일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- pca
- 교차검증
- 가설검정
- 데이터프레임
- Sawzall
- k-means
- DBSCAN
- 하둡
- 딕셔너리
- Python
- join
- 결정계수
- merge
- dict
- 다중공선성
- 분포
- 분산분석
- 병렬 쿼리 시스템
- DataFrame
- distribution
- 유사도
- pig
- 밀도기반
- SPLIT
- list
- SQL on 하둡
- T-검정
- cross validation
- hive
- p-value
- Today
- Total
one of a kind scene
[ADP 대비] 5장_5절 정형 데이터 마이닝_군집분석_SOM 본문
군집분석 SOM(Self-Organizing Map)
자가조직화지도(SOM) 알고리즘은 코호넨에 의해 제시, 개발되어 코호넨 맵이라고도 알려짐
SOM은 비지도 신경망
고차원의 데이터를 이해하기 쉬운 저차원의 뉴런으로 정렬하여 지도의 형태로 형상화
입력층과 경쟁층으로 이루어짐
1. SOM이란?
• SOM은 비지도 신경망으로 고차원의 데이터를 이해하기 쉬운 저차원의 뉴런으로 정렬하여 지도의 형태로 형상화 함
• 이러한 형상화는 입력 변수의 위치 관계를 그대로 보존한다는 특징이 있음
• 실제 공간의 입력 변수가 가까이 있으면 지도상에도 가까운 위치에 있게됨
2. SOM의 구성 : 입력층과 경쟁층 이라는 두 개의 인공신경망 층으로 구성됨
① 입력층(Input layer : 입력벡터를 받는 층)
• 입력 변수의 개수와 동일하게 뉴런 수가 존재
• 입력층의 자료는 학습을 통하여 경쟁층에 정렬되는데 경쟁층에 정렬된걸 지도(map)이라 부름
• 입력층에 있는 각각의 뉴런은 경쟁층에 있는 각각의 뉴런들과 연결되어 있으며, 이 때 완전 연결(fully connected)되어 있음
② 경쟁층(competitive layer : 2차원 격차(grid)로 구성된 층)
• 입력벡터의 특성에 따라 벡터가 한점으로 클러스터링 되는 층
• SOM은 경쟁 학습으로 각각의 뉴런이 입력 벡터와 얼마나 가까운가를 계산하여 연결 강도(connection weight)를 반복적으로 재조정하여 학습함
• 연결강도는 입력 패턴과 가장 유사한 경쟁층 뉴런이 승자가 됨
• 승자가 된 뉴런 즉, 입력층과 제일 가까운 뉴런을 BMU(Best Matching Unit)이라고 함
• 승자 독식 구조로 인해 경쟁층에는 승자 뉴런만이 나타나며, 승자와 유사한 연결 강도를 갖는 입력 패턴이 동일한 경쟁 뉴런으로 배열됨
3. SOM의 특징
• 고차원의 데이터를 저차원의 지도 형태로 형상화하기 때문에 시각적으로 이해가 쉬움
• 입력 변수의 위치 관계를 그대로 보존하기 때문에 실제 데이터가 유사하면 지도상에도 가깝게 표현됨
• 이런 특징 때문에 패턴발견, 이미지 분석 등에서 뛰어난 성능을 보임
• 역전파(Back Propagation) 알고리즘 등을 이용하는 인공신경망과 달리 단 하나의 전방 패스(feed-forward flow)를 사용함으로써 속도가 매우 빠름.
• 따라서, 실시간 학습처리를 할 수 있는 모형
구분 | 신경망 모형 | SOM |
학습 방법 | 오차역전파법(Back Propagation) | 경쟁학습방법 |
구성 | 입력층, 은닉층, 출력층 | 입력층, 2차원 격자(grid) 형태의 경쟁층 |
기계 학습 방법의 분류 | 지도학습 | 비지도 학습 |