Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- T-검정
- 분산분석
- 밀도기반
- SQL on 하둡
- k-means
- 가설검정
- pig
- 분포
- 하둡
- SPLIT
- 교차검증
- Sawzall
- list
- distribution
- hive
- join
- cross validation
- 병렬 쿼리 시스템
- 데이터프레임
- p-value
- dict
- 딕셔너리
- Python
- 결정계수
- 유사도
- 다중공선성
- DBSCAN
- merge
- pca
- DataFrame
Archives
- Today
- Total
목록재현성 문제 (1)
one of a kind scene

모델링을 할때 Accuracy를 맹신하고 '모델의 Accuracy만 높으면 좋은 모델이다' 라고 간주해버리는 경우가 있는데, 통계학에서는 p-value를 맹신하여 p-value(유의확률)가 유의수준 이내의 값이 나왔기때문에 귀무가설을 기각하고 대립가설을 채택한 후 연구가 유의미 하다고 결론을 내려버리는 경우가 있다 하지만, p-value만을 보고 연구가 유의미 하다고 결론을 내릴 수 없는 이유에 대해서 알아보고자 한다. 재현성 문제 재현성이란 똑같은 도구와 똑같은 방법으로 실험하면 누가 하든 똑같은 결과가 나와야함을 뜻합니다. 그래야 과학적이라고 할 수 있지요. 그런데 최근 생명과학과 의학, 사회과학, 심리학에서 많은 실험이 재현되지 않아 문제가 되고 있습니다. 재현성 문제의 예로 2012년 미국의 생명..
데이터 분석 이론/통계학
2020. 5. 1. 23:28