반응형

R 2

[회귀분석] 회귀분석 실습(3) - 변수선택법 (R)

이번 포스팅은 모델링을 할때 사용하는 변수선택법에 대해 알아봅니다.변수선택법변수선택법은 최적의 회귀방정식 선택에 도움을 주는 방법론이다변수선택법에는 전진선택법, 후진제거법, 단계선택법이 있다.파이썬에서는 OLS결과를 보면서 수작업으로 변수를 조정해야하지만, R에서는 step()라는 함수를 활용하여 변수선택법을 쉽게 할 수 있다. 최적회귀방정식의 선택설명변수 선택y에 영향을 미칠 수 있는 모든 설명변수 x들을 y의 값을 예측하는데 사용데이터에 설명변수 x들의 수가 많아지면 관리하는데 많은 노력이 요구되므로, 가능한 범위 내에서 적은 수의 설명변수를 선택모형선택(exploratory analysis) : 분석 데이터에 가장 잘 맞는 모형을 찾아내는 방법모든 가능한 독립변수들의 조합에 대한 회귀모형을 생성한 ..

[시계열분석] R을 활용한 시계열 분석(정상성 판단)

시계열 분석시간의 흐름에 따라 관찰된 값들을 시계열 자료라 함시계열 분석은 시간을 고려한 회귀분석이다.정상성시간에 따라 확률적인 성분이 변하지 않는다는 가정정상성이란 시계열 분석에 기초가 되는 개념이다공분산은 단지 시차에만 의존하고 실제 어느 시점 t,s에는 의존하지 않는다.따라서 비정상 시계열은 시간대에 따라 데이터가 변하고 추세와 시간대를 갖는다.시계열은 series 데이터 형태로 불러와야 한다.정상성 시계열 자료로 변환비정상성 시계열 데이터를 정상성 시계열로 바꾸는 방법은 두 가지가 있다.(1) 차분(diff) : 평균이 일정하지 않은 시계열을 정상화하는 방법으로, 현 시점 자료에서 전 시점 자료를 빼는 것일반차분(regular difference) : 바로 전 시점의 자료를 빼는 방법계절차분(se..

반응형