일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 딕셔너리
- Sawzall
- distribution
- 병렬 쿼리 시스템
- 분포
- Python
- 데이터프레임
- SQL on 하둡
- 하둡
- 가설검정
- DataFrame
- hive
- pca
- DBSCAN
- pig
- T-검정
- dict
- 밀도기반
- 다중공선성
- 유사도
- merge
- join
- 교차검증
- k-means
- 결정계수
- SPLIT
- list
- cross validation
- p-value
- 분산분석
- Today
- Total
목록분류 전체보기 (90)
one of a kind scene
import itertools print(list(itertools.product(["-", "+"], repeat = 2))) print(list(itertools.permutations(["-", "+"], 2))) print(list(itertools.combinations(["-", "+"], 2))) print(list(itertools.product(["A", "B", "C"], repeat = 2))) print(list(itertools.permutations(["A", "B", "C"], 2))) print(list(itertools.combinations(["A", "B", "C"], 2)))
I/O 가상화 하나의 물리적인 장비에 여러 개의 가상머신이 실행되고 있는 상황에서 가장 문제가 되는 것은 I/O에서의 병목 현상 1. I/O 가상화 개요 • 하나의 물리적인 장비에 여러 개의 가상머신이 실행되고 있는 상황에서 가장 문제가 되는 것은 I/O에서의 병목 현상 • 따라서, CPU 자원의 파티셔닝만으로는 가상화 기술을 제대로 활용할 수 없으며, I/O자원의 공유 및 파티셔닝이 필요 • 또한 하나의 물리적 머신에서 운영되는 가상머신 간에도 통신이 이루어져야 하며, 이를 위해 1)가상 이더넷, 2)가상 디스크 어댑터, 3)공유 이더넷 어댑터 등과 같은 기술들이 사용됨 2. I/O 가상화 종류 ① 가상 이더넷 : 물리적인 네트워크 없이도 버스를 통해 통신 가능 • 가상 이더넷은 대표적인 I/O 가상화..
메모리 가상화 메모리 가상화 : VMware기법 - VMware 하이퍼바이저의 핵심 모듈은 VMkernel - Shaodw Page Table 1. 개념 및 특징 • VMware란 한 대의 컴퓨터로 마치 여러 대의 컴퓨터를 사용하는 것과 같이 가상의 공간을 만들어주는 프로그램 • 운영체제는 메모리를 관리하기 위해 물리주소(Physical Address)와 가상주소(Virtual Address)를 사용 설명 물리주소 0부터 시작해서 실제 물리적인 메모리 크기까지 나타냄 가상주소 하나의 프로세스가 가리킬 수 있는 최대 크기를 의미하며 32비트 운영체제에서는 4GB까지 가능 • 프로그램에서의 주소는 물리적인 메모리의 주소 값이 아닌 가상주소 값이다. • 따라서, 가상주소 값의 위치(VPN, Virtual Pa..
변수선택 방법 변수선택 방법은 최적의 회귀방정식 선택에 도움을 주는 방법론이다 - 1) 전진선택법(forward selection) - 2) 후진제거법(backward elimination) - 3) 단계선택법(stepwise method) 1. 최적회귀방정식의 선택 ① 설명변수 선택 • 필요한 변수만 (상황에 따라 타협을 통해) 선택 • y에 영향을 미칠 수 있는 모든 설명변수 x들을 y의 값을 예측하는데 사용 • 데이터에 설명변수 x들의 수가 많아지면 관리하는데 많은 노력이 요구되므로, 가능한 범위 내에서 적은 수의 설명변수를 선택한다. • 라이브 서비스를 가정한다면 변수의 수가 줄어들면 계산량이 줄어 모델의 실행 속도 등이 증가하는 반사 이익도 얻을 수 있음 ② 모형선택(exploratory ana..
다중 (선형)회귀분석 다중 (선형)회귀분석에서 '다중'의 뜻은 독립변수(X)의 갯수가 2개 이상임을 뜻함 다중 (선형)회귀분석은 2개 이상의 독립변수가 종속변수에 미치는 영향을 추정하는 통계기법 1. ★다중 (선형)회귀분석에서의 검토 사항★ ① 모형의 통계적 유의성 • 모형의 통계적 유의성은 F-통계량으로 확인 • 유의수준 5% 하에서 F-통계량의 p-값이 0.05보다 작으면 추정된 회귀식은 통계적으로 유의함 • 귀무가설 : 회귀계수들은 모두 같다 • 대립가설 : 회귀계수들은 모두 같지않다(=모두 다른값이다) • F-통계량이 크면 p-value가 0.05보다 작아짐 → 귀무가설 기각 = 대립가설 채택 = 회귀계수들은 모두 같지않다 ② 회귀계수의 유의성 • 회귀계수의 유의성은 단변량 회귀분석의 회귀계수 유..
단순 (선형)회귀분석 단순 (선형)회귀분석에서 '단순'의 뜻은 독립변수(X)의 갯수가 1개임을 뜻함 단순 (선형)회귀분석은 1개의 독립변수가 종속변수에 미치는 영향을 추정하는 통계기법 1. ★단순 (선형)회귀분석에서의 검토 사항★ ① 회귀계수들이 유의미한가? • 회귀계수에 대한 t-통계량으로 계산된 p-값이 0.05보다 작으면 회귀계수가 통계적으로 유의함 ② 모형(=회귀식)의 설명력은? • 결정계수(R^2)를 확인한다 • 결정계수 값은 0~1값을 가지며, 높은 값을 가질수록 추정된 회귀식의 설명력이 높다 ③ 모형이 데이터를 잘 적합하고 있는가? = 적합성 검정 : 잔차를 살펴본다 • 잔차를 그래프로 그리고 회귀진단을 한다 2. 회귀계수의 추정 방법 = 최소제곱법 • 회귀계수 추정은 '모델을 통해서 추정된..