Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- Python
- join
- dict
- DBSCAN
- 하둡
- k-means
- 결정계수
- pca
- 병렬 쿼리 시스템
- 가설검정
- 딕셔너리
- SQL on 하둡
- Sawzall
- cross validation
- SPLIT
- 분산분석
- p-value
- list
- hive
- distribution
- 밀도기반
- 교차검증
- 다중공선성
- T-검정
- pig
- 분포
- DataFrame
- 유사도
- 데이터프레임
- merge
Archives
- Today
- Total
one of a kind scene
1장 통계분석_정규화 선형회귀(Regularized Linear Regression)와 일반화 선형회귀(GLM) 본문
ADP/이론
1장 통계분석_정규화 선형회귀(Regularized Linear Regression)와 일반화 선형회귀(GLM)
specialscene 2019. 11. 13. 20:04정규화 선형회귀(Regularized Linear Regression)
1. 라쏘회귀
- 가중치들의 @절대값의 합@을 최소화하는 것을 제약조건으로 추가
- 규제 방식은 L1 Penalty 라고 함
- 중요하지 않은 가중치는 0이 될 수 있음(=가중치의 모든 원소가 0에 가까워지는 것을 원함)
2. 릿지회귀
- 가중치들의 @제곱합@을 최소하하는 것을 제약 조건으로 추가
- 규제 방식 L2 Penalty 라고 함
- 가중치는 0에 가까워질 뿐 0이되지 않는다
- 람다가 커지면 → 가중치 값은 작아지고 정규화 정도는 커짐
람다가 작아지면 → 가중치 값은 커지고 정규화 정도는 작아짐
3. 엘라스틱 넷
- 릿지회귀와 라쏘회귀를 절충한 모델
- 가중치 절대값의 합과 제곱합을 동시에 제약 조건으로 추가
- 람다1과 람다2라는 두 개의 하이퍼 모수 갖는다
일반화 선형 회귀(GLM, Generalized Linear Regression)
1. 언제 사용?
- 종속변수(=Y)가 범주형 자료이거나 정규성을 만족하지 못할때 일반화 선형모델을 이용해 회귀분석을 한다
2. 일반화 선형 모형의 3가지 성분
- 랜덤 성분 : 종속변수(=Y)의 확률분포를 규정하는 성분
- 체계적 성분 : Y의 기대값 E(Y)를 정의하는 설명변수들 간의 선형 결합(선형식)
- 연결 함수 : 랜덤 성분과 체계적 성분을 연결하는 함수
'ADP > 이론' 카테고리의 다른 글
1장 통계분석_더빈 왓슨(Durbin Watson) 검정 (0) | 2019.11.13 |
---|---|
1장 통계분석_회귀분석의 영향력 진단 (0) | 2019.11.13 |
1장 통계분석_중심극한정리(CLT) (0) | 2019.11.13 |
1장 통계분석_교차분석 (0) | 2019.11.13 |
1장 통계분석_분산분석(ANOVA) (0) | 2019.11.13 |