Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 유사도
- merge
- list
- pca
- SPLIT
- DBSCAN
- 밀도기반
- 딕셔너리
- 결정계수
- 분포
- p-value
- 하둡
- cross validation
- 다중공선성
- 데이터프레임
- Python
- 교차검증
- k-means
- pig
- 병렬 쿼리 시스템
- 가설검정
- join
- Sawzall
- hive
- SQL on 하둡
- dict
- T-검정
- distribution
- 분산분석
- DataFrame
Archives
- Today
- Total
one of a kind scene
4-2 데이터 처리 기술_분산 데이터 저장 기술 part3_NoSQL 데이터베이스 본문
분산 데이터 저장 기술 part3_NoSQL 데이터베이스
NoSQL 데이터베이스 = 비관계형(비정형) 데이터베이스 관리 시스템
= 비정형 데이터베이스
= 즉, 데이터베이스
종류 : 구글 빅테이블, HBase, 아마존 SimpleDB
1. 개념 및 특징
• NoSQL은 빅데이터 분산처리 및 저장기술과 함께 발달된 분산 데이터베이스 기술 확장성/가용성/높은 성능 제공
• SQL 계열 쿼리 언어를 사용할 수 있어서 Not Only SQL로 불리기도함
• NoSQL은 key와 value의 형태로 자료를 저장, 빠르게 조회할 수 있는 자료 구조 제공
• 스키마 없이 동작, 구조에 대한 정의 변경 없이 자유롭게 데이터베이스의 레코드에 필드 추가 가능
• 전통적인 RDBMS의 장점인 JOIN 연산 기능은 미지원
• 대용량 처리와 대규모의 수평적 확장성 제공
• 종류 : 구글 빅테이블, 아파치 HBase, 아마존 SimpleDB, 마이크로소프트 SSDS 등이 존재
2. 구글 빅테이블
① 개념 및 특징
• 데이터베이스 클러스터 분류로 나누자면 공유 디스크(Shared Disk)방식이어서, 모든 노드가 데이터, 인덱스 파일을 공유
• 실시간 서비스, 주기적인 배치 작업, 대용량 데이터의 분석 처리에 적합
• 유사 솔루션은 아파치 HBase, NHN의 Neptune
② 데이터 모델
• 테이블 내의 모든 데이터는 row-key의 사전적인 순서로 정렬.저장