Data Analysis & ML/Python을 활용한 통계분석

[통계분석] 상관분석 (ADP준비)

YSY^ 2020. 12. 19. 17:59

상관분석

import seaborn as sns
titanic = sns.load_dataset("titanic")
titanic=titanic.iloc[:,0:7]

titanic.tail()

 

titanic.dropna(axis=0, inplace=True)
titanic.corr(method='pearson')

 

titanic.corr(method='kendall')

 

titanic.corr(method='spearman')

 

corrr = titanic.corr(method='pearson')
sns.pairplot(data=corrr)
plt.show()

 

# survived와 pclass의 피어슨 상관분석하고 검정결과 해석
import scipy.stats as stats

# 피어슨 상관계수 검정
corr = stats.pearsonr(titanic.survived, titanic.pclass)
corr #(상관계수, p-value)
# (-0.35965268208684575, 3.1621035416647744e-23)
  • p-value가 0.05이하이므로 귀무가설을 기각하고 계산된 상관계수를 활용할 수 있음
  • 약한 음의 상관관계를 가지고 있다고 해석 가능
# 스피어만 상관계수 검정
rho = stats.spearmanr(titanic.survived, titanic.pclass)
rho 
# SpearmanrResult(correlation=-0.36065641974949025, pvalue=2.346106779238448e-23)
# 캔달 상관계수 검정

tau = stats.kendalltau(titanic.survived, titanic.pclass)
tau 
# KendalltauResult(correlation=-0.3421051759132117, pvalue=5.957314337487773e-22)
728x90
반응형