일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 밀도기반
- Python
- 병렬 쿼리 시스템
- 분산분석
- pig
- SPLIT
- Sawzall
- 분포
- k-means
- 하둡
- T-검정
- 결정계수
- merge
- distribution
- cross validation
- hive
- list
- 다중공선성
- DBSCAN
- join
- dict
- p-value
- 가설검정
- 교차검증
- 유사도
- pca
- SQL on 하둡
- DataFrame
- 데이터프레임
- 딕셔너리
- Today
- Total
one of a kind scene
3장 비정형 데이터마이닝_사회연결망 분석(SNA) 본문
사회연결망 분석(SNA : Social Network Analysis)
1. 사회연결망 분석이란?
- 개인과 집단들 간의 관계를 노드와 링크로 모델링하여 그것의 위상구조와 확산 및 진화 과정을 계량적으로 분석하는 방법론
- 사회연결망에서 개인 또는 집단이 하나의 노드(node)이며, 노드 사이에 존재하는 연결은 선(link 또는 edge)로 표현
2. 사회연결망 분석 분류
- 집합론적 방법
• 각 객체들 간의 관계를 쌍(pairs of elements)으로 표현
ex) (X1, X2)
- 그래프 이론을 이용한 방법
• 객체를 점(노드 or 꼭지점)으로 표현하고, 연결은 두 점을 연결하는 선으로 표현
• 그래프 그림으로 그린다고 생각하면 됨
- 행렬을 이용한 방법
• 각 객체를 행렬의 행과 열에 대칭적으로 배치하고, i번째 객체와 j번째 객체간의 관계가(연결이) 존재하면 행렬의(i,j)번째 요소값에 1, 관계가 없으면 0 값을 준다
3. 사회연결망 분석에서 네트워크 구조를 파악하기 위한 기법
- 중심성
• 연결정도 중심성 : 한점에 직접적으로 연결된 점들의 합
• 근접 중심성 : 한 노드로부터 다른 노드에 도달하기까지 필요한 최소 단계의 합
• 매개 중심성 : 네트워크 내에서 한 점이 담당하는 매개자 혹은 중재자 역할의 정도
• 위세 중심성 : 자신의 연결 정도 중심성으로부터 발생하는 영향력과 자신과 연결된 타인의 영향력을 합하여 결정
※ 보나시치 권력지수 : 위세 중심성의 일반적인 형태로, 연결된 노드의 중요성에 가중치를 둬 노드의 중심성을 측정하는 방법
• 매력적인 오답으로 밀도 중심성이 나오는 경우가 있음
- 밀도(Density)
- 구조적 틈새(Structural hole)
- 집중도(Centralization)
4. 커뮤니티의 수를 측정하는 방법
- WALKRAP 알고리즘
• 일련의 random walk과정을 통해 커뮤니티를 발견
• 버텍스(vertex, 그래프의 상단 꼭지점)를 하나의 커뮤니티로 취급해 점차 더 큰 그룹을 병합하면서 클러스터링
- Edge Betweenness method 알고리즘
• 그래프에 존재하는 최단거리(shortest path) 중 몇 개가 그 edge(연결, 즉 link)를 거쳐가는지를 이용해 edge-betweenness 점수를 측정
• 높은 edge-betweenness 점수를 갖는 edge가 클러스터를 분리하는 속성을 가진다고 가정
'ADP > 이론' 카테고리의 다른 글
4-1 데이터 처리 프로세스_ODS(Operational Data Store) (0) | 2019.11.17 |
---|---|
4-1 데이터 처리 프로세스_ETL(Extraction Transforamtion Load) (0) | 2019.11.17 |
3장 비정형 데이터마이닝_텍스트 마이닝 (0) | 2019.11.13 |
2장 정형 데이터마이닝_군집분석의 타당성 지표 (0) | 2019.11.13 |
2장 정형 데이터마이닝_군집분석 (0) | 2019.11.13 |