일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
Tags
- 튀르키예
- 인과추론
- SparkSQL
- 데이터분석
- 기초통계학
- 회귀분석
- 딥러닝
- postgresql
- nlp
- sparkml
- 튀르키예 여행
- 텍스트마이닝
- hackerrank
- ADP실기
- text mining
- mysql
- 프로그래머스
- python
- 통계분석
- Machine Learning
- 터키 여행
- spark
- 카파도키아
- 머신러닝
- sql
- 스택/큐
- 시계열분석
- 파이썬
- pyspark
- Deep Learning
Archives
- Today
- Total
반응형
목록2024/03/20 (1)
YSY의 데이터분석 블로그
[기초통계학] 산포도와 상관계수, 그리고 상관관계
산포도 (Scatter plot) 두 변수 사이의 관계를 살펴보기 위해 산포도를 이용한다. 설명변수는 x로 표기하고 가로축에 표시 피설명변수는 y로 표기하고 세로축에 표시 설명변수와 피설명변수간 관계가 약한경우 변수 사이의 관계가 약하면 한 변수 값으로 다른 변수 값을 예측하기 어려움 위 산포도에서 중간고사에서 150점 받은 학생들의 기말고사 성적은 55점에서 175점 사이에 분포하므로 중간고사 점수로 기말고사 점수를 예측하기 어려움 설명변수와 피설명변수간 관계가 강한경우 변수 사이의 관계가 강하면 한 변수 값으로 다른 변수 값을 예측하는것이 가능해짐 아래 산포도에서 중간고사에서 150점 받은 학생들의 기말고사 성적은 105점에서 175점 사이에 분포함 (위 케이스보다 예측 범위가 감소함) 상관계수 상관..
Statistics & Math/기초통계학
2024. 3. 20. 22:19
반응형