일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 밀도기반
- cross validation
- 병렬 쿼리 시스템
- 다중공선성
- 딕셔너리
- 데이터프레임
- hive
- pca
- k-means
- merge
- T-검정
- list
- 교차검증
- DBSCAN
- SPLIT
- join
- dict
- DataFrame
- 유사도
- 하둡
- 분산분석
- p-value
- Sawzall
- 분포
- distribution
- pig
- SQL on 하둡
- 결정계수
- 가설검정
- Python
- Today
- Total
목록2020/01 (29)
one of a kind scene
시계열모형 - 정상시계열 모형 : MA, AR - 비정상시계열 모형 : ARIMA - 보통 시계열 분석은 비정상시계열 모형 → 정상시계열 모형을 바꿔서 분석함 1. 자기회귀 모형(AR 모형, autoregressive model) : p 시점 전의 자료가 현재 자료에 영향을 주는 모형 • p 시점 전의 자료가 현재 자료에 영향을 주는 모형 • AR(1) 모형 : 직전 시점 데이터로만 분석(t, t-1) • AR(2) 모형 : 연속된 3시점 정도의 데이터로 분석(t, t-1, t-2) • 자기상관함수(ACF)는 빠르게 감소하는 형태를 띄고 • 부분자기함수(PACF)의 어느 시점에서 '절단점'을 가진다 • (예) ACF가 빠르게 감소하고, PACF가 3시점에서 절단점을 갖는 그래프가 있다면, 2시점 전의 자..
시계열 자료 분석방법 - 분석 방법의 종류 - 자료 형태에 따른 분석방법 1. 시계열 자료 분석방법 • 회귀분석(계량경제)방법, Box-Jenkins 방법(=ARMA), 지수평활법, 시계열 분해법 등이 있다 (분석 방법의 분류) • 수학적 이론 모형 : 회귀분석(계량경제)방법, Box-Jenkins 방법 • 직관적 방법 : 지수평활법, 시계열 분해법으로 시간에 따른 변동이 느린 데이터 분석에 활용 • 장기 예측 : 회귀분석방법 활용 • 단기 예측 : Box-Jenkins 방법, 지수평활법, 시계열 분해법 활용 2. 자료 형태에 따른 분석방법 ① 일변량(=단변량) 시계열 분석 : 자주 들어본 모형들은 일변량 시계열 분석임 • Box-Jenkins(ARMA), 지수 평활법, 시계열 분해법, 시간(t)을 설명..
시계열 자료 및 정상성 시게열 자료와 정상성은 무엇인지 알아보자 1. 시계열 자료 개요 • 시간의 흐름에 따라 관찰된 값들을 시계열 자료라 함 • 시계열 데이터의 분석을 통해 미래의 값을 예측하고 경향, 주기, 계절성 등을 파악하여 활용 2. 시계열 자료의 종류 ① 비정상 시계열 자료 • 시계열 분석을 실시할 때 다루기 어려운 자료로 대부분의 시계열 자료가 비정상 시계열 자료 ② 정상성 시계열 자료 • 비정상 시게열을 핸들링해 다루기 쉬운 시계열 자료로 변환한 자료 (결론) • 시계열 분석은 주로 비정상 시계열 자료를 → 정상 시계열 자료로 변환하여 분석함 3. 정상성 • 모든 시점에서 일정한 평균 • 모든 시점에서 일정한 분산 • 공분산은 시점이 아니라 시차에 의존해야함 = 즉, t시점과 t+s시점의 ..
import itertools print(list(itertools.product(["-", "+"], repeat = 2))) print(list(itertools.permutations(["-", "+"], 2))) print(list(itertools.combinations(["-", "+"], 2))) print(list(itertools.product(["A", "B", "C"], repeat = 2))) print(list(itertools.permutations(["A", "B", "C"], 2))) print(list(itertools.combinations(["A", "B", "C"], 2)))
I/O 가상화 하나의 물리적인 장비에 여러 개의 가상머신이 실행되고 있는 상황에서 가장 문제가 되는 것은 I/O에서의 병목 현상 1. I/O 가상화 개요 • 하나의 물리적인 장비에 여러 개의 가상머신이 실행되고 있는 상황에서 가장 문제가 되는 것은 I/O에서의 병목 현상 • 따라서, CPU 자원의 파티셔닝만으로는 가상화 기술을 제대로 활용할 수 없으며, I/O자원의 공유 및 파티셔닝이 필요 • 또한 하나의 물리적 머신에서 운영되는 가상머신 간에도 통신이 이루어져야 하며, 이를 위해 1)가상 이더넷, 2)가상 디스크 어댑터, 3)공유 이더넷 어댑터 등과 같은 기술들이 사용됨 2. I/O 가상화 종류 ① 가상 이더넷 : 물리적인 네트워크 없이도 버스를 통해 통신 가능 • 가상 이더넷은 대표적인 I/O 가상화..
메모리 가상화 메모리 가상화 : VMware기법 - VMware 하이퍼바이저의 핵심 모듈은 VMkernel - Shaodw Page Table 1. 개념 및 특징 • VMware란 한 대의 컴퓨터로 마치 여러 대의 컴퓨터를 사용하는 것과 같이 가상의 공간을 만들어주는 프로그램 • 운영체제는 메모리를 관리하기 위해 물리주소(Physical Address)와 가상주소(Virtual Address)를 사용 설명 물리주소 0부터 시작해서 실제 물리적인 메모리 크기까지 나타냄 가상주소 하나의 프로세스가 가리킬 수 있는 최대 크기를 의미하며 32비트 운영체제에서는 4GB까지 가능 • 프로그램에서의 주소는 물리적인 메모리의 주소 값이 아닌 가상주소 값이다. • 따라서, 가상주소 값의 위치(VPN, Virtual Pa..