Data Analysis & ML/시계열분석

[시계열분석] 시계열 알고리즘 - 일반 선형확률 과정(1) - MA(이동평균)

YSY^ 2021. 8. 7. 21:40

일반 선형확률과정(General Linear Process)

"시계열 데이터가 가우시안 백색잡음의 현재값과 과거값의 선형조합"

w값은 1보다 작아야한다.(1보다 작아야 제곱을 해도 무한대보다 작아짐)

  • 세부 알고리즘:
    • WN(White Noise)
    • MA(Moving Average)
    • AR(Auto-Regressive)
    • ARMA(Auto-Regressive Moving Average)
    • ARIMA(Auto-Regressive Integrated Moving Average)
    • SARIMA(Seasonal ARIMA)

 

WN(White Noise)

1) 잔차들은 정규분포이고, (unbiased) 평균 0과 일정한 분산을 가져야 함:**
2) 잔차들이 시간의 흐름에 따라 상관성이 없어야 함:**
- 자기상관함수(Autocorrelation Fundtion(ACF))를 통해 Autocorrelation = 0인지 확인
- 공분산(Covariance):


- 자기상관함수(Autocorrelation Function):
Yt와 Yt-1과의 관계를 나타낸 것임

- 편자기상관함수(Partial Autocorrelation Function): $s$와 $k$사이의 상관성을 제거한 자기상관함수

 

  • 특성요약:
    • 강정상 과정(Stictly Stationary Process)
    • 강정상 예시로 시계열분석 기본알고리즘 중 가장 중요함
    • 시차(lag)가 0일 경우, 자기공분산은 확률 분포의 분산이 되고 시차가 0이 아닌 경우, 자기공분산은 0.
    • 시차(lag)가 0일 경우, 자기상관계수는 1이 되고 시차가 0이 아닌 경우, 자기상관계수는 0.

 

MA(q) : 알고리즘의 차수(q)가 유한한 가우시안 백색잡음과정의 선형조합

- Exponential Smoothing 내  Moving Average Smoothing은 과거의 Trend-Cycle을 추정하기 위함이고, MA는 미래 값을 예측하기 위함

-Autocorrelation은 q까지만 값이 존재하고 그 이후에는 0이 나온다.

 

MA(1)

  • 이론적인 ACF그래프에서는 딱 1까지만 값이 나타남
  • 이론적인 PACF그래프에서는 천천히 값이 감소함
  • 샘플링된 ACF에서도 딱 1까지 값이 나타남.(샘플과 이론은 다르기에 값도 다르게 나타날 수 있음)
728x90
반응형