반응형

Statsmodel 2

[회귀분석] 회귀분석 실습(1) - OLS 회귀분석 결과 해석 및 범주형 변수 처리 (Statsmodel)

Statsmodel을 활용한 회귀분석 statsmodels 패키지에서는 OLS 클래스를 사용하여 선형 회귀분석을 실시한다 독립변수와 종속변수가 모두 포함된 데이터프레임이 생성되며, 상수항 결합은 하지 않아도 된다. from_formula 메서드의 인수로 종속변수와 독립변수를 지정하는 formula 문자열을 넣는다. data 인수로는 독립변수와 종속변수가 모두 포함된 데이터프레임을 넣는다. EX) model = OLS.from_formula(formula, data=df) 또한 독립변수만 있는 데이터프레임 X와 종속변수만 있는 데이터프레임 y를 인수로 넣어서 만들 수도 있다. 이 때는 독립변수만 있는 데이터프레임 X가 상수항을 가지고 있어야 한다. EX) model = OLS(dfy, dfX) fit 메서..

[회귀분석] 로지스틱 회귀분석(3) - 로지스틱 회귀분석 해석

이번 포스팅에서는 Statsmodel을 활용한 로지스틱 회귀분석을 해석하는 포스팅입니다. 로지스틱 회귀분석 해석 데이터는 타이타닉 데이터를 사용합니다. import seaborn as sns import statsmodels.api as sm import pandas as pd import numpy as np titanic = sns.load_dataset("titanic") from sklearn.preprocessing import LabelEncoder # sex 레이블 인코딩 encoder = LabelEncoder() encoder.fit(titanic['sex']) sex = encoder.transform(titanic['sex']) #male이 1 femail이 0 titanic['sex..

반응형