Statistics & Math/기초통계학

[기초통계학] 표준편차와 자유도

YSY^ 2024. 3. 14. 22:28

제곱근-평균-제곱 (Root Mean Square) (RMS)

계산은 표현의 역순(제곱 후 평균, 최종적으로 제곱근)

  1. 제곱 (S) : 모든 수를 제곱하여 부호를 없앤다.
  2. 평균 (M) : 제곱된 값들의 평균을 구한다.
  3. 제곱근 (R) : 제곱-평균된 값에 제곱근을 취한다.

RMS공식과 예시

표준편차

  • 표준편차(SD)는 “평균으로부터의 편차들”의 RMS와 “대략” 비슷 (편차들에 대해 적용한 RMS)
  • 다만 중간에 있는 M을 계산할때 1을빼서 계산 (CF. 이것과 관계있는 개념이 자유도)

표준편차 계산공식

  • 표준편차는 관측치들이 평균으로부터 얼마나 떨어져 있는지 알려줌
    • 평균값을 중심으로 평균적으로 s만큼 퍼져 있다는 의미
  • 만약 어떤 집단의 평균값이 3이고 표준편차가 1.5라면, 좌우로 1.5(1.5 ~ 4.5)정도 퍼져있다는 것.
  • 68-95법칙
    • 관측치들의 약 68% 정도가 평균으로부터 1 표준편차 이내로 떨어져 있다.
    • 관측치들의 약 95% 정도가 평균으로부터 2 표준편차 이내로 떨어져 있다.

자유도 (degrees of freedom)

  • 주어진 조건 하에서 자유롭게 변화할 수 있는 개수
  • 자유도는 합쳐진 값들 중에서 실질적으로 독립인 값들의 개수
  • 표준편차 계산하는 경우의 자유도는 ”자료의 개수 - 1”
  • 표준편차 계산의 대상이 되는 편차들의 합은 0이 됨. 편차들의 합이 0이 된다 는 하나의 제약조건이 자유도를 1만큼 감소시킨 것

 

EX) 극단적으로 자료의 개수가 하나인 경우 

  • 편차는 단 하나뿐이고 그 값은 0임
  • 0에 대해 제곱의 평균(MS(mean square))를 계산할 때 자유도를 고려하지 않으면 0/1=0이지만, 자유도를 고려하면 0/(1-1)=0/0으로 부정형(indefinite form)이 됨
  • 즉, 단 하나의 자료만을 가지고는 퍼진 정도를 알 수 없음. 이 때 퍼진 정도는 0이 아니 라 ‘알 수 없다(부정형)’가 정답임.
  • 따라서, 자유도를 고려해야 함

표준편차와 관련된 정의

측정오차(measurement error)

  • 관측치와 실제 값의 차이
  • 측정오차가 존재하면, (관측치) = (실제 값) + (측정오차)
  • 측정오차의 대략적인 크기는 관측치들의 표준편차(SD)를 통해 알 수 있음
  • 표준편차(SD)의 크기는 한 번의 관측에서 측정오차가 어느 정도 될지 알려 줌

편의(bias)

  • 방향성을 갖는 하나의 체계적인 오차
  • 측정오차와 함께 편의가 있으면, (관측치)=(실제 값)+(편의)+(측정오차)

이탈값(outlier)

  • 극단적인 관측치

 

해당포스팅은 류근관 교수님의 <그림과 수치를 이용한 자료의 정리>강의를 참고하여 작성하였습니다

728x90
반응형