반응형

시계열분석 27

[시계열분석] 시계열 변수 추출 실습(Python)(4) - 시계열 데이터 준비(train/test set 분리) (bike-sharing-demand dataset)

[시계열분석] 시계열 변수(빈도/추세/계절성/주기/시계열분해/더미변수/지연값) :ysyblog.tistory.com/179 [시계열분석] 시계열 변수 추출 실습(Python)(1) - 시계열 분해 (bike-sharing-demand dataset) :ysyblog.tistory.com/209 [시계열분석] 시계열 변수 추출 실습(Python)(2) - 이동평균/지연값/증감폭/그룹화 (bike-sharing-demand dataset) : ysyblog.tistory.com/210 [시계열분석] 시계열 변수 추출 실습(Python)(3) - 종속변수들과 독립변수들과의 관계를 파악하기 위한 시각화 (bike-sharing-demand dataset) : ysyblog.tistory.com/211 해당 포스..

[시계열분석] 시계열 변수 추출 실습(Python)(3) - 종속변수들과 독립변수들과의 관계를 파악하기 위한 시각화 (bike-sharing-demand dataset)

[시계열분석] 시계열 변수(빈도/추세/계절성/주기/시계열분해/더미변수/지연값) :ysyblog.tistory.com/179 [시계열분석] 시계열 변수 추출 실습(Python)(1) - 시계열 분해 (bike-sharing-demand dataset) :ysyblog.tistory.com/209 [시계열분석] 시계열 변수 추출 실습(Python)(2) - 이동평균/지연값/증감폭/그룹화 (bike-sharing-demand dataset) : ysyblog.tistory.com/210 해당 포스팅은 위 포스팅들에 이어 진행됩니다. 각 변수들의 분포 파악 # histogram plot raw_fe.hist(bins=20, grid=True, figsize=(16,12)) plt.show() target 변수 ..

[시계열분석] 시계열 변수 추출 실습(Python)(2) - 이동평균/지연값/증감폭/그룹화 (bike-sharing-demand dataset)

[시계열분석] 시계열 변수(빈도/추세/계절성/주기/시계열분해/더미변수/지연값) : ysyblog.tistory.com/179 [시계열분석] 시계열 변수 추출 실습(Python)(1) - 시계열 분해 (bike-sharing-demand dataset) : ysyblog.tistory.com/209 해당 포스팅은 위 포스팅들에 이어 진행됩니다. 이동평균(moving average) 계산 # comparison of several moving average values pd.concat([raw_all[['count']],#시간정보(파랑) raw_all[['count']].rolling(24).mean(), #데일리 패턴을 보겠다.(주황색) raw_all[['count']].rolling(24*7).mean..

[시계열분석] 시계열 변수 추출 실습(Python)(1) - 시계열 분해 (bike-sharing-demand dataset)

ysyblog.tistory.com/179?category=1186605 [시계열분석] 시계열 변수(빈도/추세/계절성/주기/시계열분해/더미변수/지연값)시계열분석은 어떤문제를 다루나 - regression, regulariRegularization Algorithms, clustering에서 주로 쓰며 ,Regression이 많이 쓰인다. 시계열 분석과 기계학습의 차이 확률 과정(Stochastic Process): 상관..ysyblog.tistory.com해당 포스팅은 위 포스팅에 이어 진행됩니다. Import Package and Dataset# Ignore the warningsimport warnings# warnings.filterwarnings('always') #항상 warning가 뜨게함wa..

[시계열분석] 시계열 변수(빈도/추세/계절성/주기/시계열분해/더미변수/지연값)

시계열분석은 어떤문제를 다루나 - regression, regulariRegularization Algorithms, clustering에서 주로 쓰며 ,Regression이 많이 쓰인다. 시계열 분석과 기계학습의 차이 확률 과정(Stochastic Process): 상관 관계를 가지는 무한개의 변수의 순서열 시계열 데이터(Time Series Data): 일정한 시간 간격으로 기록된 확률과정의 샘플 독립변수(𝑥𝑡xt)와 알고자 하는 종속변수(𝑦𝑡yt)가 시간단위(𝑡t)를 포함 모델의 출력(Output)은 𝑦y의 시간 𝑡t에서의 예측값 기계학습과 시계열예측 간 큰 차이가 존재하기에, 시계열 변수생성은 약간의 조정들을 요구함 시계열 변수 신규 변수를 생성하는 것은 분석에서 가장 중요하고 시간이 많이 걸리는..

[PostgreSQL] 사용자 로그데이터(Log Data) 시계열분석(1) - 등록추이분석/지속률/정착률

이번포스팅은 로그데이터를 시계열로 분석하는 포스팅입니다. 로그데이터 매출 분석은 아래 포스팅들을 참고해주세요 1. 사용자 로그데이터(Log Data) 매출분석(1) - 사용자들의 특징 찾기 : ysyblog.tistory.com/146?category=1176025 2. 사용자 로그데이터(Log Data) 매출분석(2) - DECILE분석 : ysyblog.tistory.com/147?category=1176025 3. 사용자 로그데이터(Log Data) 매출분석(3) - RFM 분석 : ysyblog.tistory.com/148?category=1176025 데이터 소개 및 Import 먼저 데이터를 데이터베이스에 Import합니다. 사용자데이터와 로그데이터는 이전에 썻던 데이터와 유사하지만, 효과적인..

SQL & DB/PostgreSQL 2021.01.18

[시계열분석] R을 활용한 시계열 분석(정상성 판단)

시계열 분석시간의 흐름에 따라 관찰된 값들을 시계열 자료라 함시계열 분석은 시간을 고려한 회귀분석이다.정상성시간에 따라 확률적인 성분이 변하지 않는다는 가정정상성이란 시계열 분석에 기초가 되는 개념이다공분산은 단지 시차에만 의존하고 실제 어느 시점 t,s에는 의존하지 않는다.따라서 비정상 시계열은 시간대에 따라 데이터가 변하고 추세와 시간대를 갖는다.시계열은 series 데이터 형태로 불러와야 한다.정상성 시계열 자료로 변환비정상성 시계열 데이터를 정상성 시계열로 바꾸는 방법은 두 가지가 있다.(1) 차분(diff) : 평균이 일정하지 않은 시계열을 정상화하는 방법으로, 현 시점 자료에서 전 시점 자료를 빼는 것일반차분(regular difference) : 바로 전 시점의 자료를 빼는 방법계절차분(se..

반응형