Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- DataFrame
- 분포
- 분산분석
- cross validation
- T-검정
- pig
- 병렬 쿼리 시스템
- dict
- hive
- 밀도기반
- distribution
- 교차검증
- 유사도
- Sawzall
- pca
- 딕셔너리
- 데이터프레임
- SPLIT
- 다중공선성
- SQL on 하둡
- list
- p-value
- 결정계수
- Python
- 가설검정
- DBSCAN
- merge
- k-means
- 하둡
- join
Archives
- Today
- Total
목록Impala (1)
one of a kind scene
4-2 데이터 처리 기술_분산 컴퓨팅 기술 part3_SQL on 하둡(임팔라)
분산 컴퓨팅 기술 part3_SQL on 하둡(임팔라) SQL on 하둡 : 실시간 SQL 질의 분석 기술 중 임팔라에 대해서 살펴봄 임팔라외 SQL on 하둡 참고 2019/11/18 - [ADP] - 4-1 데이터 처리 프로세스_대용량의 비정형 데이터 처리방법 1. SQL on 하둡 개요 • 실시간 처리라는 측면에서 하둡의 제약사항을 극복하기 위한 시도중 하나인 SQL on 하둡은 실시간 SQL 질의 분석 기술 • SQL on 하둡 기술은 하둡에 저장된 대용량 데이터를 대화형식의 SQL 질의를 통해서 처리하고 분석하는 것. 이 중에서 임팔라(Impala)에 대해서 살펴봄 2. 임팔라의 개념 및 특징 • SQL on 하둡 기술 중 먼저 대중에게 공개된 기술, Cloudera(클라우데라)에서 드레멜(Dr..
ADP/이론
2019. 12. 23. 20:25