일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- pca
- 가설검정
- 병렬 쿼리 시스템
- merge
- join
- DBSCAN
- T-검정
- pig
- 결정계수
- DataFrame
- 다중공선성
- hive
- 교차검증
- cross validation
- k-means
- dict
- SQL on 하둡
- distribution
- 데이터프레임
- list
- 분포
- 하둡
- 딕셔너리
- Python
- SPLIT
- 분산분석
- p-value
- 유사도
- Sawzall
- 밀도기반
- Today
- Total
목록분류 전체보기 (90)
one of a kind scene

CPU 가상화 CPU 가상화에서는 '하이퍼바이저(Hypervisor)'를 떠올리자 1. 하이퍼바이저(Hypervisor)의 개념 및 특징 • 물리적 서버 위에 존재하는 가상화 레이어(층)을 통해 운영체제를 수행하는데 필요한 하드웨어 환경을 가상으로 만들어 준다. • 하이퍼바이저(Hypervisor)는 호스트 컴퓨터에서 다수의 운영 체제를 동시에 실행하도록 하기위한 논리적인 플랫폼(platform)을 의미 • 엄격하게 구분할 경우에는 차이가 있지만 일반적으로 가상머신(Virtual Machine)을 '하이퍼바이저'라고 할 수 있으며, 하이퍼바이저는 VMM(Virtual Machine Monitor)라고도 함 • 하이퍼바이저는 서버 가상화 기술의 핵심으로 x86 계열 서버 가상화에서는 소프트웨어 기반으로 하..
서버 가상화 - 인프라 기술은 클라우드 컴퓨팅의 근간이 되는 기술이며, 인프라 기술들 중에서도 가장 기반이 되는 기술은 서버 가상화 - 클라우드 컴퓨팅 환경에선 x86 계열의 서버가 가장 많이 사용되어 x86 서버 가상화 기술에 대해서 서술함. - x86 계열 서버 군의 가장 큰 특징은 하드웨어, CPU, 운영체제의 공급업체가 모두 다름. - 따라서, 이런 환경 때문에 가상화 기술도 업체에 따라 제공되는 수준이 매우 다양 - 따라서, x86 서버의 가상화 기술은 하나의 업체만으로 설명할 수 없으며, 다른 업체와의 협력 관계와 기술 조합의 안정성 등을 살펴야함 1. 서버 가상화 개념 및 특징 개념 • 물리적인 서버와 운영체제 사이에 적절한 계층을 추가해 서버를 사용하는 사용자에게 물리적인 자원은 숨기고 논..
클라우드 인프라 기술 part1_클라우드 컴퓨팅 클라우드 컴퓨팅 - 초기 클라우드 서비스는 SaaS 중심으로 발전 되었으며, Iaas와 PaaS 형태로 발전 - 클라우드 컴퓨팅의 개념 및 특징 • 클라우드 컴퓨팅은 동적으로 확장 할 수 있는 가상화 자원들을 인터넷으로 서비스하는 기술 • 클라우드 서비스는 IaaS, SaaS, PaaS 등 크게 3가지로 나뉨 구분 정의 사례 IaaS (Infrastructure as a Service) • 네트워크 장비, 서버와 스토리지 등과 같은 IT 인프라 자원을 빌려주는 클라우드 서비스 • VMware, Xen, KVM SaaS (Software as a Service) • 서비스로서의 소프트웨어를 의미하며, 소프트웨어를 웹에서 사용할 수 있게해주는 서비스 • 아마존..

회귀분석의 가정 회구분석의 가정 중에는 선형성도 있기때문에 선형회귀분석의 가정이라고도 함 1. 선형성 • 입력변수(X)와 출력변수(Y)의 관계가 선형이다.(선형 회귀분석에서 가장 중요한 가정) • 그래프로 확인하려면 X, Y 플롯을 봐야함(X, 잔차 그래프랑 헷갈리지 말것) 2. 등분산성 • 오차(혹은 잔차)의 분산이 입력변수와 무관하게 일정 • 오차와 입력변수간에 아무런 관련성이 없게 무작위적으로 고루 분포되어야함 • ∩ 모양의 그래프는 X값이 커짐에 따라 잔차가 커지거나 작아지거나 하기때문에 오차와 입력변수간에 아무런 관련성이 없다고 보기힘듦 • 제일 우측 그림 역시 X값이 커짐에 따라 잔차가 커지는 모습을 보여 오차와 입력변수간에 아무런 관련성이 없다고 보기힘듦 3. 독립성 • 입력변수(X) 간에 ..
상관분석(Correlation Analysis) 두 변수간의 상관관계를 알아보기위해 상관계수를 이용하여 두 변수 간의 상관 정도를 알아보는 분석방법 1. 상관관계 강도 • 절대값 0.7을 넘으면 강한 상관관계 존재 • 절대값 0.3을 넘으면 약한 상관관계 존재 • 절대값 0.3보다 낮으면 거의 상관이 없다고 판단 2. 상관분석의 유형 구분 피어슨 스피어만 개념 등간척도 및 비율척도로 측정된 두 변수들의 상관관계를 측정하는 방식 서열척도인 두 변수들의 상관관계를 측정하는 방식 특징 연속형 변수, 정규성 가정 가장 많이 사용되는 상관계수 순서형 변수, 비모수적 방법 순위를 기준으로 상관관계 측정 상관계수 피어슨 상관계수(=적률상관계수, r(감마)) 스피어만 상관계수(=순위상관계수, 로우(ρ)) 3. 상관분석..
모수적 검정 vs 비모수적 검정 통계적 검정에서 모집단의 모수에 대한 검정은 모수적 검정과 비모수적 검정으로 구분됨 1. 모수적 방법 • 검정하고자 하는 모집단의 분포에 대한 가정을 하고, 그 가정하에서 검정통계량과 검정통계량의 분포를 유도해 검정을 실시하는 방법 (모수적 검정 및 모수적 검정 방법) • 가정된 분포의 모수에 대해 가설을 설정 • 관측된 자료를 이용해 구한 표본평균, 표본분산 등을 이용해 검정을 실시 2. 비모수적 방법 : 순위(rank), 부호(sign) 이라는 단어 나오면 비모수 떠올리자 • 자료가 추출된 모집단의 분포에 대한 아무 제약을 가하지 않고 검정을 실시하는 방법 • 관측된 자료가 특정분포를 따른다고 가정할 수 없는 경우에 이용 • 관측된 자료의 수가 많지 않거나(30개 미만..