[ADP 대비] 5장_5절 정형 데이터 마이닝_군집분석_SOM
군집분석 SOM(Self-Organizing Map)
자가조직화지도(SOM) 알고리즘은 코호넨에 의해 제시, 개발되어 코호넨 맵이라고도 알려짐
SOM은 비지도 신경망
고차원의 데이터를 이해하기 쉬운 저차원의 뉴런으로 정렬하여 지도의 형태로 형상화
입력층과 경쟁층으로 이루어짐
1. SOM이란?
• SOM은 비지도 신경망으로 고차원의 데이터를 이해하기 쉬운 저차원의 뉴런으로 정렬하여 지도의 형태로 형상화 함
• 이러한 형상화는 입력 변수의 위치 관계를 그대로 보존한다는 특징이 있음
• 실제 공간의 입력 변수가 가까이 있으면 지도상에도 가까운 위치에 있게됨
2. SOM의 구성 : 입력층과 경쟁층 이라는 두 개의 인공신경망 층으로 구성됨
① 입력층(Input layer : 입력벡터를 받는 층)
• 입력 변수의 개수와 동일하게 뉴런 수가 존재
• 입력층의 자료는 학습을 통하여 경쟁층에 정렬되는데 경쟁층에 정렬된걸 지도(map)이라 부름
• 입력층에 있는 각각의 뉴런은 경쟁층에 있는 각각의 뉴런들과 연결되어 있으며, 이 때 완전 연결(fully connected)되어 있음
② 경쟁층(competitive layer : 2차원 격차(grid)로 구성된 층)
• 입력벡터의 특성에 따라 벡터가 한점으로 클러스터링 되는 층
• SOM은 경쟁 학습으로 각각의 뉴런이 입력 벡터와 얼마나 가까운가를 계산하여 연결 강도(connection weight)를 반복적으로 재조정하여 학습함
• 연결강도는 입력 패턴과 가장 유사한 경쟁층 뉴런이 승자가 됨
• 승자가 된 뉴런 즉, 입력층과 제일 가까운 뉴런을 BMU(Best Matching Unit)이라고 함
• 승자 독식 구조로 인해 경쟁층에는 승자 뉴런만이 나타나며, 승자와 유사한 연결 강도를 갖는 입력 패턴이 동일한 경쟁 뉴런으로 배열됨
3. SOM의 특징
• 고차원의 데이터를 저차원의 지도 형태로 형상화하기 때문에 시각적으로 이해가 쉬움
• 입력 변수의 위치 관계를 그대로 보존하기 때문에 실제 데이터가 유사하면 지도상에도 가깝게 표현됨
• 이런 특징 때문에 패턴발견, 이미지 분석 등에서 뛰어난 성능을 보임
• 역전파(Back Propagation) 알고리즘 등을 이용하는 인공신경망과 달리 단 하나의 전방 패스(feed-forward flow)를 사용함으로써 속도가 매우 빠름.
• 따라서, 실시간 학습처리를 할 수 있는 모형
구분 | 신경망 모형 | SOM |
학습 방법 | 오차역전파법(Back Propagation) | 경쟁학습방법 |
구성 | 입력층, 은닉층, 출력층 | 입력층, 2차원 격자(grid) 형태의 경쟁층 |
기계 학습 방법의 분류 | 지도학습 | 비지도 학습 |