일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- 딕셔너리
- Sawzall
- 분포
- pca
- distribution
- cross validation
- SQL on 하둡
- 결정계수
- 교차검증
- SPLIT
- 유사도
- merge
- join
- Python
- pig
- DataFrame
- p-value
- 다중공선성
- 하둡
- 가설검정
- T-검정
- 데이터프레임
- 분산분석
- k-means
- DBSCAN
- list
- hive
- 밀도기반
- dict
- 병렬 쿼리 시스템
- Today
- Total
목록결정계수 (3)
one of a kind scene

결정계수란(R square)? - 모형의 설명력을 뜻함 - 회귀식을 통해서 계산된 예측 값이 실제 y값을 얼마나 설명하는지를 뜻함 수정된 결정계수(adjusted R square)는 언제 필요? - 다변량 회귀분석에서는 독립변수가 유의하든, 유의하지 않든 독립변수의 수가 많아지면 결정계수(R square)가 높아짐 - 이러한 결정계수의 단점을 보완하기 위해 수정된 결정계수가 필요 - 아래 결정계수 식을 보면 p = 독립변수의 갯수를 뜻하는데, p가 분모에 위치하면서 p가 증가함에 따라 분자에 있는 R square 값도 증가하는 영향을 어느정도 상쇄해줌 - 따라서, 독립변수의 갯수를 고려하기때문에 수정된 결정계수가 결정계수를 보완해줄 수 있음 - 보통 수정된 결정계수는 결정계수보다 작은 값으로 산출되는 특..

다중 (선형)회귀분석 다중 (선형)회귀분석에서 '다중'의 뜻은 독립변수(X)의 갯수가 2개 이상임을 뜻함 다중 (선형)회귀분석은 2개 이상의 독립변수가 종속변수에 미치는 영향을 추정하는 통계기법 1. ★다중 (선형)회귀분석에서의 검토 사항★ ① 모형의 통계적 유의성 • 모형의 통계적 유의성은 F-통계량으로 확인 • 유의수준 5% 하에서 F-통계량의 p-값이 0.05보다 작으면 추정된 회귀식은 통계적으로 유의함 • 귀무가설 : 회귀계수들은 모두 같다 • 대립가설 : 회귀계수들은 모두 같지않다(=모두 다른값이다) • F-통계량이 크면 p-value가 0.05보다 작아짐 → 귀무가설 기각 = 대립가설 채택 = 회귀계수들은 모두 같지않다 ② 회귀계수의 유의성 • 회귀계수의 유의성은 단변량 회귀분석의 회귀계수 유..

단순 (선형)회귀분석 단순 (선형)회귀분석에서 '단순'의 뜻은 독립변수(X)의 갯수가 1개임을 뜻함 단순 (선형)회귀분석은 1개의 독립변수가 종속변수에 미치는 영향을 추정하는 통계기법 1. ★단순 (선형)회귀분석에서의 검토 사항★ ① 회귀계수들이 유의미한가? • 회귀계수에 대한 t-통계량으로 계산된 p-값이 0.05보다 작으면 회귀계수가 통계적으로 유의함 ② 모형(=회귀식)의 설명력은? • 결정계수(R^2)를 확인한다 • 결정계수 값은 0~1값을 가지며, 높은 값을 가질수록 추정된 회귀식의 설명력이 높다 ③ 모형이 데이터를 잘 적합하고 있는가? = 적합성 검정 : 잔차를 살펴본다 • 잔차를 그래프로 그리고 회귀진단을 한다 2. 회귀계수의 추정 방법 = 최소제곱법 • 회귀계수 추정은 '모델을 통해서 추정된..