one of a kind scene

3장 비정형 데이터마이닝_사회연결망 분석(SNA) 본문

ADP/이론

3장 비정형 데이터마이닝_사회연결망 분석(SNA)

specialscene 2019. 11. 13. 23:14

사회연결망 분석(SNA : Social Network Analysis)

 

1. 사회연결망 분석이란?

 

    - 개인과 집단들 간의 관계를 노드와 링크로 모델링하여 그것의 위상구조와 확산 및 진화 과정을 계량적으로 분석하는 방법론

 

    - 사회연결망에서 개인 또는 집단이 하나의 노드(node)이며, 노드 사이에 존재하는 연결은 선(link 또는 edge)로 표현

 

 

2. 사회연결망 분석 분류

 

    - 집합론적 방법

      • 각 객체들 간의 관계를 쌍(pairs of elements)으로 표현

      ex) (X1, X2)

 

    - 그래프 이론을 이용한 방법

      • 객체를 점(노드 or 꼭지점)으로 표현하고, 연결은 두 점을 연결하는 선으로 표현

      • 그래프 그림으로 그린다고 생각하면 됨

 

    - 행렬을 이용한 방법

      • 각 객체를 행렬의 행과 열에 대칭적으로 배치하고, i번째 객체와 j번째 객체간의 관계가(연결이) 존재하면 행렬의(i,j)번째 요소값에 1, 관계가 없으면 0 값을 준다

 

 

3. 사회연결망 분석에서 네트워크 구조를 파악하기 위한 기법

 

    - 중심성

      • 연결정도 중심성 : 한점에 직접적으로 연결된 점들의 합

      • 근접 중심성 : 한 노드로부터 다른 노드에 도달하기까지 필요한 최소 단계의 합

      • 매개 중심성 : 네트워크 내에서 한 점이 담당하는 매개자 혹은 중재자 역할의 정도

      • 위세 중심성 : 자신의 연결 정도 중심성으로부터 발생하는 영향력과 자신과 연결된 타인의 영향력을 합하여 결정

        ※ 보나시치 권력지수 : 위세 중심성의 일반적인 형태로, 연결된 노드의 중요성에 가중치를 둬 노드의 중심성을 측정하는 방법

      • 매력적인 오답으로 밀도 중심성이 나오는 경우가 있음

 

    - 밀도(Density)

 

    - 구조적 틈새(Structural hole)

 

    - 집중도(Centralization)

 

4. 커뮤니티의 수를 측정하는 방법

 

    - WALKRAP 알고리즘

      • 일련의 random walk과정을 통해 커뮤니티를 발견

      • 버텍스(vertex, 그래프의 상단 꼭지점)를 하나의 커뮤니티로 취급해 점차 더 큰 그룹을 병합하면서 클러스터링

 

    - Edge Betweenness method 알고리즘

      • 그래프에 존재하는 최단거리(shortest path) 중 몇 개가 그 edge(연결, 즉 link)를 거쳐가는지를 이용해 edge-betweenness 점수를 측정

      • 높은 edge-betweenness 점수를 갖는 edge가 클러스터를 분리하는 속성을 가진다고 가정