Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- 가설검정
- 교차검증
- Python
- join
- 유사도
- DBSCAN
- 딕셔너리
- merge
- T-검정
- 분포
- hive
- 병렬 쿼리 시스템
- p-value
- 분산분석
- 다중공선성
- cross validation
- DataFrame
- 밀도기반
- SQL on 하둡
- k-means
- pig
- list
- 데이터프레임
- 하둡
- pca
- SPLIT
- 결정계수
- distribution
- dict
- Sawzall
Archives
- Today
- Total
목록ETL이란? (1)
one of a kind scene

ETL(Extraction Transforamtion Load / 추출, 변형, 적재) 1. ETL이란? - ETL은 데이터의 이동 및 변환 절차와 관련된 업계 표준 용어 - 다양한 데이터 원천으로부터 데이터를 추출 및 변환하여 운영 데이터 스토어(ODS), 데이터 웨어하우스(DW), 데이터마트(DW) 등에 데이터를 적재하는 작업의 핵심 구성요소 - ETL은 대용량 데이터에 대한 일괄(Batch)작업(일괄작업 = 실시간의 반대개념)을 통해 정형 데이터를 통합 - 그렇다면, 정형 데이터의 실시간 혹은 근접 실시간 처리와 통합에 관한 기술은? → CDC와 EAI 2. ETL의 기능? - Extraction(추출) : 다양한 데이터 원천(Source)에서 부터 데이터 획득 - Transformation(변형)..
ADP/이론
2019. 11. 17. 21:17