Statistics & Math/기초통계학

[기초통계학] 데이터와 통계량 - 평균과 중앙값

YSY^ 2024. 3. 12. 22:20

데이터와 통계량

  • 변수 : 어떤 대응관계로 변화하는 수, 혹은 함수관계로 대응하며 주어진 범위 안에서 변화하는수
    → 변수는 데이터로 구성되고, 데이터를 근거로 변수의 특성을 파악
  • 데이터 : 조사의 목적에 맞는 변수를 기반으로, 표본으로부터 수집된 자료
    → 사회과학분야에서 보통 통계조사를 할때는 표본의 특징을 표현하기 위해 단일자료 수집
    → 핵심적 연구나 조사를 목적으로 할 때는 다중자료를 수집

 

기초 통계량

평균 (Mean)

  • 평균(mean)은 관측치의 총합을 관측치의 개수로 나누어 구한다.
  • 중심경향도 : 데이터를 종합하여 그 중심을 이루는 값이 어느정도가 될지를 구한 것
  • 통계에서 가장 많이 사용되는 중심경향도(u)
  •  표본의 특성을 제시할 때 가장 먼저 사용

중앙값 (Median)

  • 절반 이상의 숫자들이 이 값보다 크거나 같고 동시에 절반 이상의 숫자들이 이 값 보다 작거나 같은 수
  • 히스토그램은 중앙값에서 그 면적이 양분됨
  • 중앙값은 n 이 홀수이면 (n+1)/2번째로 크거나 작은 숫자임 
  • 중앙값은 n이 짝수이면 n/2번째 숫자와 (n+1)/2번째 숫자의 평균으로 정의
  • median voter theorem: 중앙값이 최소 절대 편차(least absolute deviation, LAD)의 해로 얻어진다는 것과 수학적으로 같은 내용

 

평균과 중앙값

  • 평균은 극단적인 값의 영향을 받음
  • 중앙값은 극단적인 값의 영향을 받지 않음
  • 극단적인 값이 존재하는 경우 평균보다 중앙값이 중심을 더 잘 나타냄

위의 세개의 히스토그램에서 중앙값은 언제나 2이지만, 평균은 빨간색 화살표를 따라서 이동함

최빈값

  • 표본에서 가장 많이 나타나는 관측치
  • 최대 부분으로 쏠림현상이 나타날 수 있기 때문에 자주쓰이지는 않음

 

해당 포스팅은 류근관 교수님의 <그림과 수치를 이용한 자료의 정리>강의를 참고하여 작성하였습니다

728x90
반응형