one of a kind scene

[ADP 대비] 5장_5절 정형 데이터 마이닝_군집분석_SOM 본문

카테고리 없음

[ADP 대비] 5장_5절 정형 데이터 마이닝_군집분석_SOM

specialscene 2020. 2. 2. 23:56

군집분석 SOM(Self-Organizing Map)

자가조직화지도(SOM) 알고리즘은 코호넨에 의해 제시, 개발되어 코호넨 맵이라고도 알려짐

SOM은 비지도 신경망

고차원의 데이터를 이해하기 쉬운 저차원의 뉴런으로 정렬하여 지도의 형태로 형상화

입력층과 경쟁층으로 이루어짐

출처 : https://brunch.co.kr/@hvnpoet/69

 

1. SOM이란?

     • SOM은 비지도 신경망으로 고차원의 데이터를 이해하기 쉬운 저차원의 뉴런으로 정렬하여 지도의 형태로 형상화 함

     • 이러한 형상화는 입력 변수의 위치 관계를 그대로 보존한다는 특징이 있음

     • 실제 공간의 입력 변수가 가까이 있으면 지도상에도 가까운 위치에 있게됨

 

2. SOM의 구성 : 입력층과 경쟁층 이라는 두 개의 인공신경망 층으로 구성됨

     ① 입력층(Input layer : 입력벡터를 받는 층)

          • 입력 변수의 개수와 동일하게 뉴런 수가 존재

          • 입력층의 자료는 학습을 통하여 경쟁층에 정렬되는데 경쟁층에 정렬된걸 지도(map)이라 부름

          • 입력층에 있는 각각의 뉴런은 경쟁층에 있는 각각의 뉴런들과 연결되어 있으며, 이 때 완전 연결(fully connected)되어 있음

     ② 경쟁층(competitive layer : 2차원 격차(grid)로 구성된 층)

          • 입력벡터의 특성에 따라 벡터가 한점으로 클러스터링 되는 층

          • SOM은 경쟁 학습으로 각각의 뉴런이 입력 벡터와 얼마나 가까운가를 계산하여 연결 강도(connection weight)를 반복적으로 재조정하여 학습함

          • 연결강도는 입력 패턴과 가장 유사한 경쟁층 뉴런이 승자가 됨

          • 승자가 된 뉴런 즉, 입력층과 제일 가까운 뉴런을 BMU(Best Matching Unit)이라고 함

          • 승자 독식 구조로 인해 경쟁층에는 승자 뉴런만이 나타나며, 승자와 유사한 연결 강도를 갖는 입력 패턴이 동일한 경쟁 뉴런으로 배열됨

 

3. SOM의 특징

     • 고차원의 데이터를 저차원의 지도 형태로 형상화하기 때문에 시각적으로 이해가 쉬움

     •  입력 변수의 위치 관계를 그대로 보존하기 때문에 실제 데이터가 유사하면 지도상에도 가깝게 표현됨    

     • 이런 특징 때문에 패턴발견, 이미지 분석 등에서 뛰어난 성능을 보임

     • 역전파(Back Propagation) 알고리즘 등을 이용하는 인공신경망과 달리 단 하나의 전방 패스(feed-forward flow)를 사용함으로써 속도가 매우 빠름.

     • 따라서, 실시간 학습처리를 할 수 있는 모형

 

구분 신경망 모형 SOM
학습 방법 오차역전파법(Back Propagation) 경쟁학습방법
구성 입력층, 은닉층, 출력층 입력층, 2차원 격자(grid) 형태의 경쟁층
기계 학습 방법의 분류 지도학습 비지도 학습