일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 결정계수
- cross validation
- 유사도
- dict
- DBSCAN
- pig
- pca
- k-means
- SQL on 하둡
- DataFrame
- 병렬 쿼리 시스템
- 다중공선성
- 교차검증
- merge
- 밀도기반
- Python
- SPLIT
- 하둡
- 가설검정
- list
- 데이터프레임
- p-value
- 분산분석
- Sawzall
- distribution
- T-검정
- hive
- join
- 딕셔너리
- 분포
- Today
- Total
목록다중공선성 (2)
one of a kind scene
다중 (선형)회귀분석 다중 (선형)회귀분석에서 '다중'의 뜻은 독립변수(X)의 갯수가 2개 이상임을 뜻함 다중 (선형)회귀분석은 2개 이상의 독립변수가 종속변수에 미치는 영향을 추정하는 통계기법 1. ★다중 (선형)회귀분석에서의 검토 사항★ ① 모형의 통계적 유의성 • 모형의 통계적 유의성은 F-통계량으로 확인 • 유의수준 5% 하에서 F-통계량의 p-값이 0.05보다 작으면 추정된 회귀식은 통계적으로 유의함 • 귀무가설 : 회귀계수들은 모두 같다 • 대립가설 : 회귀계수들은 모두 같지않다(=모두 다른값이다) • F-통계량이 크면 p-value가 0.05보다 작아짐 → 귀무가설 기각 = 대립가설 채택 = 회귀계수들은 모두 같지않다 ② 회귀계수의 유의성 • 회귀계수의 유의성은 단변량 회귀분석의 회귀계수 유..
차원축소 알고리즘인 PCA알고리즘에 대해서 정리하고자 함 PCA를 왜 쓰는지 그리고 쓰면 머가 좋은지에 대해서 결론적인 얘기만 하고자함 흔히, PCA 알고리즘을 차원축소 알고리즘으로 알고있다. 그렇기 때문에 면접때 PCA를 왜 사용했냐고 물어봤을때, 단순히 차원을 축소하기 위해서 썻다고 답변하는 경우가 허다하다. (이 답변은 30점 정도 줄 수 있는 답변이다.) PCA를 사용하면 다중공선성 문제, 차원의 저주 문제를 해결할 수 있고, 차원을 축소해주기때문에 사람이 쉽게 관찰하고 이해할 수 있는 2차원으로 데이터들을 보여줄 수 있기때문에 사용했다고 답변해야 좋은 답변이라 할 수 있다. PCA는 어떤 알고리즘인가? PCA는 차원축소 알고리즘으로 생각하기보다는 기존 변수를 조합해 새로운 변수를 만드는 변수 추..