Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- T-검정
- cross validation
- DBSCAN
- pig
- distribution
- merge
- 밀도기반
- 가설검정
- join
- Sawzall
- 교차검증
- dict
- list
- 유사도
- 병렬 쿼리 시스템
- hive
- SQL on 하둡
- 다중공선성
- 분포
- 하둡
- Python
- pca
- 데이터프레임
- SPLIT
- 분산분석
- k-means
- p-value
- DataFrame
- 결정계수
- 딕셔너리
Archives
- Today
- Total
목록ETL (1)
one of a kind scene
4-1 데이터 처리 프로세스_ETL(Extraction Transforamtion Load)
ETL(Extraction Transforamtion Load / 추출, 변형, 적재) 1. ETL이란? - ETL은 데이터의 이동 및 변환 절차와 관련된 업계 표준 용어 - 다양한 데이터 원천으로부터 데이터를 추출 및 변환하여 운영 데이터 스토어(ODS), 데이터 웨어하우스(DW), 데이터마트(DW) 등에 데이터를 적재하는 작업의 핵심 구성요소 - ETL은 대용량 데이터에 대한 일괄(Batch)작업(일괄작업 = 실시간의 반대개념)을 통해 정형 데이터를 통합 - 그렇다면, 정형 데이터의 실시간 혹은 근접 실시간 처리와 통합에 관한 기술은? → CDC와 EAI 2. ETL의 기능? - Extraction(추출) : 다양한 데이터 원천(Source)에서 부터 데이터 획득 - Transformation(변형)..
ADP/이론
2019. 11. 17. 21:17