Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- 딕셔너리
- 병렬 쿼리 시스템
- k-means
- DataFrame
- join
- DBSCAN
- 분포
- hive
- distribution
- 밀도기반
- 결정계수
- pca
- T-검정
- merge
- pig
- 다중공선성
- dict
- 교차검증
- list
- Python
- 유사도
- 하둡
- 분산분석
- p-value
- 데이터프레임
- 가설검정
- cross validation
- Sawzall
- SPLIT
- SQL on 하둡
Archives
- Today
- Total
one of a kind scene
[결정계수] R square와 adjusted R square 본문
결정계수란(R square)?
- 모형의 설명력을 뜻함
- 회귀식을 통해서 계산된 예측 값이 실제 y값을 얼마나 설명하는지를 뜻함
수정된 결정계수(adjusted R square)는 언제 필요?
- 다변량 회귀분석에서는 독립변수가 유의하든, 유의하지 않든 독립변수의 수가 많아지면 결정계수(R square)가 높아짐
- 이러한 결정계수의 단점을 보완하기 위해 수정된 결정계수가 필요
- 아래 결정계수 식을 보면 p = 독립변수의 갯수를 뜻하는데, p가 분모에 위치하면서 p가 증가함에 따라 분자에 있는 R square 값도 증가하는 영향을 어느정도 상쇄해줌
- 따라서, 독립변수의 갯수를 고려하기때문에 수정된 결정계수가 결정계수를 보완해줄 수 있음
- 보통 수정된 결정계수는 결정계수보다 작은 값으로 산출되는 특징이 있음
'데이터 분석 이론 > 통계학' 카테고리의 다른 글
로지스틱 regression에서 이탈도(deviance) (0) | 2020.05.01 |
---|---|
다중 회귀모형과 달리 로지스틱 회귀모형에서 F-값을 이용한 모형의 유의성을 확인하지 않는 이유? (1) | 2020.05.01 |
p-value를 맹신하면 안되는 이유 (0) | 2020.05.01 |
[연속형 확률 분포] 정규분포, t-분포, F-분포, 카이제곱 분포 (2) | 2020.04.30 |
통계학에서 여러 종류의 분포(Distribution)를 공부해야하는 이유? (0) | 2020.04.30 |