Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- T-검정
- 분산분석
- pca
- 교차검증
- 딕셔너리
- Sawzall
- Python
- DBSCAN
- cross validation
- join
- SPLIT
- 결정계수
- 밀도기반
- p-value
- SQL on 하둡
- 유사도
- dict
- merge
- distribution
- 분포
- k-means
- pig
- 하둡
- 병렬 쿼리 시스템
- 데이터프레임
- 다중공선성
- hive
- list
- DataFrame
- 가설검정
Archives
- Today
- Total
목록유사도 종류 (1)
one of a kind scene

벡터화한 A, B의 유사도를 구하는 방법에는 유클리디안 유사도로 대표되는 거리 기반 유사도와 코사인 유사도로 대표되는 각도 기반 유사도가 있다 각도 기반 유사도와 거리 기반 유사도는 언제 사용해야 좋은지 알아보자 1) 거리 기반 유사도 위 그림 중 좌측 그림을 보면 거리 기반 유사도는 좌표를 기준으로 생각했을때 비슷한(혹은 가까운) 좌표에 있는 점들이 유사도가 높다고 측정됨 2) 각도 기반 유사도 위 그림 중 우측 그림을 보면 각도 기반 유사도는 좌표를 기준으로 생각했을때 x축과 (0, 0)에서 좌표까지 이르는 점선 주변에 있는 점들이 유사도가 높다고 측정됨 아래 그림은 벡터 간의 코사인 유사도 값을 설명해주고 있음 쉽게 설명하면, 평행(=기울기가 같은)을 이루고 방향이 같은 벡터간의 유사도가 가장 높음..
데이터 분석 이론/데이터 사이언스
2019. 12. 12. 06:11