일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 가설검정
- cross validation
- pig
- list
- 병렬 쿼리 시스템
- hive
- 딕셔너리
- DataFrame
- T-검정
- 하둡
- dict
- 분산분석
- distribution
- 결정계수
- 밀도기반
- 유사도
- SQL on 하둡
- 교차검증
- pca
- 다중공선성
- merge
- Python
- Sawzall
- k-means
- join
- DBSCAN
- 데이터프레임
- SPLIT
- 분포
- p-value
- Today
- Total
one of a kind scene
[ADP 대비] 4장_4절 통계분석_시계열 분석 part2_시계열 자료 분석방법 본문
시계열 자료 분석방법
- 분석 방법의 종류
- 자료 형태에 따른 분석방법
1. 시계열 자료 분석방법
• 회귀분석(계량경제)방법, Box-Jenkins 방법(=ARMA), 지수평활법, 시계열 분해법 등이 있다
(분석 방법의 분류)
• 수학적 이론 모형 : 회귀분석(계량경제)방법, Box-Jenkins 방법
• 직관적 방법 : 지수평활법, 시계열 분해법으로 시간에 따른 변동이 느린 데이터 분석에 활용
• 장기 예측 : 회귀분석방법 활용
• 단기 예측 : Box-Jenkins 방법, 지수평활법, 시계열 분해법 활용
2. 자료 형태에 따른 분석방법
① 일변량(=단변량) 시계열 분석 : 자주 들어본 모형들은 일변량 시계열 분석임
• Box-Jenkins(ARMA), 지수 평활법, 시계열 분해법, 시간(t)을 설명변수로 한 회귀모형
• 주가, 소매물가지수 등 하나의 변수(=설명변수 시간(t)가 1개)에 관심을 갖는 경우의 시계열 분석
② 다중(=다변량) 시계열 분석 : 잘 못들어 본 모형들
• 계량경제 모형, 전이함수 모형, 개입분석, 상태공간 분석, 다변량 ARIMA 등
※ 계량경제(econometrics)
: 시계열 데이터에 대한 회귀분석(예 : 이자율, 인플레이션이 환율에 미치는 요인)
3. 이동평균법 → MA모형에 쓰임
① 이동평균법의 개념
• 과거로부터 현재까지의 시계열 자료를 대상으로 1)일정기간별 이동평균을 계산하고, 2)이들의 추세를 파악하여 다음 기간을 예측하는 방법
• 시계열 자료에서 계절변동과 불규칙변동을 제거하여 추세변동과 순환변동만 가진 시계열로 변환하는 방법으로도 사용됨
• n개의 시계열 데이터를 m기간으로 이동평균하면 n-m+1개의 이동평균 데이터가 생성됨
② 이동평균법의 특징
• 간단하고 쉽게 미래를 예측할 수 있으며, 자료의 수가 많고, 안정된 패턴을 보이는 경우 예측의 품질(quality)가 높음
• 특정 기간 안에 속하는 시계열에 대해서는 동일한 가중치 부여
• 시계열 자료에 뚜렷한 추세가 있거나 불규칙변동이 심하지 않은경우 → 짧은기간(m의 갯수가 적음)의 평균을 사용
• 불규칙변동이 심한 경우 → 긴 기간(m의 갯수가 많음)의 평균을 사용
• 이동평균법에서 가장 중요한 것은 적절한 기간을 사용하는 것. 즉, 적절한 n의 개수를 결정하는 것
4. 지수평활법
① 지수평활법의 개념
• 일정기간의 평균을 이용하는 이동평균법과는 달리 모든 시계열 자료를 사용하여 평균을 구함
• 시간의 흐름에 따라 최근 시계열에 더 많은 가중치를 부여하여 미래를 예측하는 방법
• (1-α) < 0 이기때문에 계속 곱해진다는 것은 값이 작아진다는 것을 의미
② 지수평활법의 특징
• 단기간에 발생하는 불규칙변동을 평활하는 방법
※ 평활 : 변동의 폭이 큰 시계열 자료 값을 변화가 완만한 값으로 '변환'하는 것
• 이동편균법과 마찬가지로 자료의 수가 많고 안정된 패턴을 보이는 경우일수록 예측 품질이 높음
• 지수평활법에서 가중치 역할을 하는 것은 지수평활계수(α)
• 불규칙변동이 큰 시계열의 경우 → 지수평활계수는 작은 값으로 설정
• 불규칙변동이 작은 시계열의 경우 → 지수평활계수는 큰 값으로 설정
• 일반적으로 지수평활계수 α는 0.05 ≤ α ≤0.03 값을 갖는다
• 지수평활계수는 과거로 갈수록 지속적으로 감소
= (1-α) < 0 이기때문에 계속 곱해진다는 것은 값이 작아진다는 것을 의미
• 지수평활법은 불규칙변동의 영향을 제거하는 효과가 있으며, 중기 예측 이상에 주로 사용
(단, 단순지수 평활법의 경우, 장기추세나 계절변동이 포함된 시계열의 예측에는 적합하지 않음)
※ 이동평균법은 계절변동, 불규칙변동 제거에 효과, m에 따라 단기 ~ 장기 예측 가능