2장 정형 데이터마이닝_군집분석
군집분석(Clustering)
1. 군집분석의 종류
- 계층적 군집분석
• 합병형 : 단일(최단)/완전(최장)/평균/중심/Ward 연결법
• 분리형 : 다이아나(DIANA)방법
- 분할적 군집분석
• 프로토타입 : k-means, 퍼지 군집
• 분포기반 : 혼합분포군집(Mixture Distribution Clustering)
• 밀도기반 : 중심밀도 군집, 밀도기반
2. 밀도기반 군집분석
- DBSCAN(Density-Based Spatial Clustering of Application with Noise)
• 대표적인 밀도기반 군집화 기법
• 군집화와 동시에 noise를 표시함으로써 데이터를 보다 정확하게 이해할 수 있음
- OPTICS
• 군집화 구조 식별을 위해 부가적 순서를 생성
- DENCLUE(DENsity-based ClUstEring)
• 밀도 분포함수에 기초한 군집화 방법
3. 격자기반 군집분석
- 데이터가 존재하는 공간을 격자구조로 이루어진 유한개의 셀들로 양자화한 뒤, 데이터 포인트 대신 셀을 이용해 군집화 과정을 수행하는 기법
- 빠른 처리시간을 가지며, 데이터 내 객체 수에 독립적이며, 양자화된 공간의 각 차원에서 셀의 수에만 의존
- STING(Statistical Information Grid)
• 격자 셀에 저장되어 있는 통계정보를 탐색
- WaveCluster
• Wavelet 변환 기법을 사용하여 객체들을 군집화하는 격자기반 기법
- CLIQUE(Clustering in QUEst)
• 고차원 데이터 공간의 군집화를 위한 격자 및 밀도기반 기법
블로그 내 다른 군집분석 글 : https://specialscene.tistory.com/10