일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- k-means
- 밀도기반
- T-검정
- 다중공선성
- dict
- Python
- Sawzall
- 딕셔너리
- SQL on 하둡
- list
- distribution
- 가설검정
- DataFrame
- cross validation
- pig
- 데이터프레임
- DBSCAN
- p-value
- 결정계수
- 분산분석
- join
- 병렬 쿼리 시스템
- 분포
- pca
- hive
- SPLIT
- 유사도
- merge
- 교차검증
- 하둡
- Today
- Total
one of a kind scene
2장 정형 데이터마이닝_군집분석 본문
군집분석(Clustering)
1. 군집분석의 종류
- 계층적 군집분석
• 합병형 : 단일(최단)/완전(최장)/평균/중심/Ward 연결법
• 분리형 : 다이아나(DIANA)방법
- 분할적 군집분석
• 프로토타입 : k-means, 퍼지 군집
• 분포기반 : 혼합분포군집(Mixture Distribution Clustering)
• 밀도기반 : 중심밀도 군집, 밀도기반
2. 밀도기반 군집분석
- DBSCAN(Density-Based Spatial Clustering of Application with Noise)
• 대표적인 밀도기반 군집화 기법
• 군집화와 동시에 noise를 표시함으로써 데이터를 보다 정확하게 이해할 수 있음
- OPTICS
• 군집화 구조 식별을 위해 부가적 순서를 생성
- DENCLUE(DENsity-based ClUstEring)
• 밀도 분포함수에 기초한 군집화 방법
3. 격자기반 군집분석
- 데이터가 존재하는 공간을 격자구조로 이루어진 유한개의 셀들로 양자화한 뒤, 데이터 포인트 대신 셀을 이용해 군집화 과정을 수행하는 기법
- 빠른 처리시간을 가지며, 데이터 내 객체 수에 독립적이며, 양자화된 공간의 각 차원에서 셀의 수에만 의존
- STING(Statistical Information Grid)
• 격자 셀에 저장되어 있는 통계정보를 탐색
- WaveCluster
• Wavelet 변환 기법을 사용하여 객체들을 군집화하는 격자기반 기법
- CLIQUE(Clustering in QUEst)
• 고차원 데이터 공간의 군집화를 위한 격자 및 밀도기반 기법
블로그 내 다른 군집분석 글 : https://specialscene.tistory.com/10
'ADP > 이론' 카테고리의 다른 글
3장 비정형 데이터마이닝_텍스트 마이닝 (0) | 2019.11.13 |
---|---|
2장 정형 데이터마이닝_군집분석의 타당성 지표 (0) | 2019.11.13 |
2장 정형 데이터마이닝_재표본추출(Resampling) (0) | 2019.11.13 |
2장 정형 데이터마이닝_분류분석(Classification) (0) | 2019.11.13 |
2장 정형 데이터마이닝_딥러닝(Deep Learning) (0) | 2019.11.13 |