일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- DataFrame
- cross validation
- 분산분석
- pca
- Python
- 분포
- SQL on 하둡
- 딕셔너리
- 다중공선성
- 데이터프레임
- dict
- SPLIT
- 교차검증
- hive
- 병렬 쿼리 시스템
- join
- p-value
- merge
- 유사도
- k-means
- pig
- 가설검정
- distribution
- DBSCAN
- 하둡
- list
- 밀도기반
- 결정계수
- T-검정
- Sawzall
- Today
- Total
목록distribution (2)
one of a kind scene
포스팅을 하게된 이유 분포를 공부하다보면 분포간 연관성이 있어 자주 헷갈린다. 즉, 분포를 명확하게 구별지어 이해하지 못하면 분포에 대한 지식을 활용하지 못하고 혼동만 생기게 된다. 그렇기 때문에 분포간 유사점과 차이점을 비교하여 명확하게 이해하기 위해 포스팅을 하게 되었다. Must Learning with R(url : https://wikidocs.net/book/2841)에서 대부분의 내용을 가져왔음을 미리 말씀드립니다. 코드를 활용한 활용이나 수식을 활용한 설명보다는 이론적인 내용에 집중하였습니다. 0. 서론 : 통계 분석에는 크게 2가지 분석이 있다. • 1) (집단간) 차이를 보는 분석 : t-test(t-검정)과 분산분석(ANOVA) 등 • 2) 관계를 보는 분석 : 회귀분석 등 1. 정규..
통계학을 공부하다보니, 크게 이산확률분포 연속확률분포를 공부하게되고 세부적으로 포아송분포, 이항분포 or t-분포, F-분포, 카이제곱 분포 등의 여러 종류의 분포를 공부하게된다. 이러한 분포들에 대해서 공부하다보니 이런 분포들을 왜 공부해야하고 언제 어떻게 쓰이는지에 대해서 궁금증을 갖게되어 포스팅을 하게 되었다. ● 통계학에서 분포를 공부해야하는 이유? • 통계학에서 분포를 배우는 이유는 관찰된 값이 얼마나 큰 지, 작은 지를 알 수 있다. • 반대로 분포를 모르면 관찰된 값이 얼마나 큰 지, 작은 지를 얘기할 수 없다. • 분포를 배워야 가설검정을 통해 통계적 유의성을 논할 수 있습니다. • 즉, 자료에 대한 분포를 보고 분포에 대한 가설을 세우게 되면, 가설검정을 통해 가설을 실제로 따르는지에 대..