Data Analysis & ML/시계열분석

[시계열분석] 시계열 알고리즘 - 적분 선형확률 과정(2) - SARIMA

YSY^ 2021. 9. 25. 21:00

SARIMA(Seasonal ARIMA)

ARIMA 모형은 Non-seasonal 데이터 또는 Non-seasonal ARIMA 모델을 가정 -> 계절성 패턴 반영 모델 필요

  • SARIMAX 클래스 이용하면 Multiplicated SARIMA(p,d,q)x(P,D,Q,m) 모형 추정 및 예측 가능  
  • SARIMAX의 fit 메서드는 모수를 추정하여 그 결과를 SARIMAX Result 클래스 인스턴스로 반환 

매개변수 설명

  • p  : ARIMA의 AR 성분과 동일
  • d  : 연속 차분 작업이 수행되는 횟수
  • q  : ARIMA의 MA 성분과 동일
  • m : 계절성 시차
  • P (계절적 AR 구성 요소) :현재 관측치에 대한 과거 시차의 영향. p 와 달리 과거 시차는 m 시차의 배수로 현재 시차와 분리. 예를 들어, m = 12이고 P = 2이면 현재 관측치는 12번째 시차와 24번째 시차의 관측치를 사용하여 추정
  • D (계절 차분 구성 요소) : 계절 차이 계산 횟수. 연속 관측 (첫 번째 지연된 시리즈)으로 차이가 수행되는 d 와 달리 여기서는 시리즈와 m 번째 지연된 시리즈 간에 차이가 수행
  • Q (계절적 MA 성분) : 현재 관측치에 대한 과거 잔차의 효과. q 와 달리 과거 시차는 m 시차의 배수로 현재 시차와 분리됩니다 . 예를 들어, m = 12이고 Q = 2이면 현재 관측 값은 12번째 시차와 24번째 시차의 잔차를 사용하여 추정

매개변수 추정

  • p : 계열에 대한 PACF 그림을 플로팅하고 유의한 시차 수
  • d : 시리즈를 정상으로 변환하는 데 필요한 연속 차분 연산의 수
  • q : 계열에 대한 ACF 플롯을 플로팅하고 유의한 시차 수
  • m : 몇 가지 계절적 패턴이 관찰 된 후 시차 수
  • P : PACF 플롯을 다시 플로팅하고 m의 배수로 구분 된 유의한 시차 수
  • D : 계열을 정상으로 변환하는 데 필요한 계절적 차이의 수
  • Q : ACF 플롯을 다시 플로팅하고 m의 배수로 구분 된 유의 한 시차 수

 

Simple SARIMA

  • 계절성 시차에서만 ACF가 유의하지 않는 경우

SARIMA(0,0,0)(0,0,1,12) : 각 월의 시계열 자료의 값이 현재의 백색잡음과 작년 동월 백색잡음에 의해 생성

  • ACF 그래프에서 계절성시차(Lag12)에서의 계수가 유의수준을 벗어난 증가를 보임(다른 시차에서는 유의수준 내 존재)
  • PACF 그래프에서 반복되는 계절성시차들의 지수적 감소를 보임  

SARIMA(0,0,0)(1,0,0,12): 각 월의 시계열 자료의 값이 작년 동월 자료값과 현재의 백색잡음에 의해 생성

  • ACF 그래프에서 반복되는 계절성시차들의 지수적 감소를 보임  
  • PACF 그래프에서 계절성시차(Lag12)에서의 계수가 유의수준을 벗어난 증가를 보임(다른 시차에서는 유의수준 내 존재) 

SARIMA(0,0,0)(0,1,1,12) : 계절성 차분이 필요한 경우

  • 이론적으로는 깔끔하게 나오지만, 샘플링 한 데이터에서는 그렇지 않음
  • 오히려 PACF는 뒤로갈수록 불규칙적이됨 -> 계절성이 존재하는 것으로 별도로 처리해야함

 

SARIMA(0,0,0)(1,1,0,12)

 

Multiplicated SARIMA

  • 계절성 시차와 그 주변의 시차에서도 ACF가 유의하지 않음
  • simple sarima의 특성을 포함하면서 추세에 대한 차수가 반영되어 앞뒤로 여러개의 상관성이 높아지는 것.

SARIMA(0,0,1)(0,0,1,12)

  • 계절주기 12고 계절주기 자료들 간에는 ARIMA(0,0,1), 비계절 자료들 간에는 ARIMA(0,0,1)  
  • 시차(Lag)가 1, 11, 12, 13인 경우를 제외하고는 자기상관계수가 모두 0 
  • 즉 Lag 12에서 앞 뒤로 1씩 추가가 되는 것.

 

SARIMA(0,0,1)(1,0,0,12)

  • 계절주기 12고 계절주기 자료들 간에는 ARIMA(1,0,0), 비계절 자료들 간에는 ARIMA(0,0,1)  
  • 시차(Lag)가 12의 배수와 그 앞/뒤인 경우(12k, 12(k+1), 12(k-1))를 제외하고는 자기상관계수가 모두 0 

 

SARIMA(0,1,0)(0,1,0,12)

  • 계절주기 12고 계절주기 간 1차 차분 ARIMA(0,1,0), 비계절 자료들 간 1차 차분 ARIMA(0,1,0)  
  • 시계열을 1차 차분하고 그 시계열을 다시 12간격 차분하면 백색잡음    

 

SARIMA(0,1,1)(0,1,1,12)

  • 계절주기 12고 계절/비계절 자료 모두 1차 차분 ARIMA(0,1,1)  
  • 시계열을 1차 차분하고 그 시계열을 다시 12간격 차분하면 계절/비계절 자료 모두 ARIMA(0,0,1)    

 

SARIMA(1,1,0)(1,1,0,12)

  • 계절주기 12고 계절/비계절 자료 모두 1차 차분 ARIMA(1,1,0)  
  • 시계열을 1차 차분하고 그 시계열을 다시 12간격 차분하면 계절/비계절 자료 모두 ARIMA(1,0,0)    

 

 

728x90
반응형