Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- join
- distribution
- 결정계수
- T-검정
- merge
- list
- p-value
- k-means
- SQL on 하둡
- 분포
- 데이터프레임
- 다중공선성
- 밀도기반
- 하둡
- hive
- 교차검증
- cross validation
- DataFrame
- Sawzall
- 유사도
- pca
- Python
- DBSCAN
- dict
- 딕셔너리
- 분산분석
- SPLIT
- 병렬 쿼리 시스템
- 가설검정
- pig
Archives
- Today
- Total
목록k-means (1)
one of a kind scene
[ADP 대비] 5장_5절 정형 데이터 마이닝_군집분석
군집분석 군집분석은 비교사 학습(Unsupervised learning)의 대표적인 방법론 - 계층적 군집분석 : 전통적 군집분석 방법, 군집의 갯수를 제일 나중에 선정 - 비계층적 군집분석 : 군집의 개수를 제일 먼저 선정 1. 계층적 군집 vs 분할적 군집 Linkage Method (참고) *와드 연결법 : 군집내 편차들의 제곱합을 고려한 방법 2. 거리계산 방식 ① 연속형 변수의 경우 구분 특징 유클리디안 거리(=L2 거리) • 가장 많이 사용되는 일반적인 거리계산 방식 • 통계적 개념이내포되지않아 변수들의 산포 정도가 전혀 감안되지 않음 표준화 거리 • 통계적 개념이 내포된 거리계산 방식 • 변수를 표준편차(D)로 척도 변환한 후 유클리디안 거리를 계산하는 방식 • 표준편차로 척도 변환(=표준화..
카테고리 없음
2020. 2. 2. 23:49