Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- 딕셔너리
- distribution
- 결정계수
- list
- pig
- SPLIT
- hive
- DataFrame
- k-means
- pca
- 교차검증
- 다중공선성
- 분포
- 가설검정
- 데이터프레임
- merge
- SQL on 하둡
- 하둡
- 유사도
- cross validation
- join
- dict
- 병렬 쿼리 시스템
- 밀도기반
- p-value
- 분산분석
- T-검정
- Python
- Sawzall
- DBSCAN
Archives
- Today
- Total
목록통계 (1)
one of a kind scene
통계학에서 여러 종류의 분포(Distribution)를 공부해야하는 이유?
통계학을 공부하다보니, 크게 이산확률분포 연속확률분포를 공부하게되고 세부적으로 포아송분포, 이항분포 or t-분포, F-분포, 카이제곱 분포 등의 여러 종류의 분포를 공부하게된다. 이러한 분포들에 대해서 공부하다보니 이런 분포들을 왜 공부해야하고 언제 어떻게 쓰이는지에 대해서 궁금증을 갖게되어 포스팅을 하게 되었다. ● 통계학에서 분포를 공부해야하는 이유? • 통계학에서 분포를 배우는 이유는 관찰된 값이 얼마나 큰 지, 작은 지를 알 수 있다. • 반대로 분포를 모르면 관찰된 값이 얼마나 큰 지, 작은 지를 얘기할 수 없다. • 분포를 배워야 가설검정을 통해 통계적 유의성을 논할 수 있습니다. • 즉, 자료에 대한 분포를 보고 분포에 대한 가설을 세우게 되면, 가설검정을 통해 가설을 실제로 따르는지에 대..
데이터 분석 이론/통계학
2020. 4. 30. 00:19