상관분석
import seaborn as sns
titanic = sns.load_dataset("titanic")
titanic=titanic.iloc[:,0:7]
titanic.tail()
titanic.dropna(axis=0, inplace=True)
titanic.corr(method='pearson')
titanic.corr(method='kendall')
titanic.corr(method='spearman')
corrr = titanic.corr(method='pearson')
sns.pairplot(data=corrr)
plt.show()
# survived와 pclass의 피어슨 상관분석하고 검정결과 해석
import scipy.stats as stats
# 피어슨 상관계수 검정
corr = stats.pearsonr(titanic.survived, titanic.pclass)
corr #(상관계수, p-value)
# (-0.35965268208684575, 3.1621035416647744e-23)
- p-value가 0.05이하이므로 귀무가설을 기각하고 계산된 상관계수를 활용할 수 있음
- 약한 음의 상관관계를 가지고 있다고 해석 가능
# 스피어만 상관계수 검정
rho = stats.spearmanr(titanic.survived, titanic.pclass)
rho
# SpearmanrResult(correlation=-0.36065641974949025, pvalue=2.346106779238448e-23)
# 캔달 상관계수 검정
tau = stats.kendalltau(titanic.survived, titanic.pclass)
tau
# KendalltauResult(correlation=-0.3421051759132117, pvalue=5.957314337487773e-22)
728x90
반응형
'Data Analysis & ML > Python을 활용한 통계분석' 카테고리의 다른 글
[통계분석] 탐색적 요인분석(FA) (ADP실기 준비) (0) | 2020.12.24 |
---|---|
[통계분석] PCA(주성분분석) (ADP실기 준비) (0) | 2020.12.24 |
[통계분석] 분산분석(ANOVA), 이항검정 (ADP실기 준비) (0) | 2020.12.19 |
[통계분석] 교차분석 (ADP 실기 준비) (0) | 2020.12.19 |
[통계분석] 표본추출과 T검정 (ADP실기 준비) (0) | 2020.12.19 |