일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- SQL on 하둡
- T-검정
- k-means
- 딕셔너리
- dict
- DataFrame
- 유사도
- 밀도기반
- p-value
- Python
- DBSCAN
- pca
- 가설검정
- 다중공선성
- SPLIT
- pig
- hive
- list
- 교차검증
- 결정계수
- distribution
- 분포
- 병렬 쿼리 시스템
- join
- Sawzall
- 데이터프레임
- cross validation
- merge
- 분산분석
- 하둡
- Today
- Total
목록분산분석 (2)
one of a kind scene

포스팅을 하게된 이유 분포를 공부하다보면 분포간 연관성이 있어 자주 헷갈린다. 즉, 분포를 명확하게 구별지어 이해하지 못하면 분포에 대한 지식을 활용하지 못하고 혼동만 생기게 된다. 그렇기 때문에 분포간 유사점과 차이점을 비교하여 명확하게 이해하기 위해 포스팅을 하게 되었다. Must Learning with R(url : https://wikidocs.net/book/2841)에서 대부분의 내용을 가져왔음을 미리 말씀드립니다. 코드를 활용한 활용이나 수식을 활용한 설명보다는 이론적인 내용에 집중하였습니다. 0. 서론 : 통계 분석에는 크게 2가지 분석이 있다. • 1) (집단간) 차이를 보는 분석 : t-test(t-검정)과 분산분석(ANOVA) 등 • 2) 관계를 보는 분석 : 회귀분석 등 1. 정규..
분산분석(ANOVA : Analysis of Variance) - 언제 사용? : 두 개 이상의 집단에서 그룹 평균 간 차이를 그룹 내 변동(=분산)에 비교하여 살펴보는 데이터 분석 방법 : 즉, 두 개 이상 집단들의 평균 간 차이에 대한 통계적 유의성을 검증(두 개 이상 집단들의 평균을 비교)하는 방법 : F-검정 통계량 이용 - 종류 ① 일원배치 분산분석(One-way ANOVA) → 독립변수(=x) : 1개, 종속변수(=y) : 1개 ex) 독립변수(=x) : 성별, 종속변수(=y) : 시험점수 : 분산분석에서 반응값(=y)에 대해 하나의 범주형 변수의 영향을 알아보기 위해 사용되는 검증방법 : 모집단의 수에는 제한이 없으며, 각 표본의 수는 같지 않아도 됨 : F-검정 통계량 이용 : F=MSA ..