제곱근-평균-제곱 (Root Mean Square) (RMS)
계산은 표현의 역순(제곱 후 평균, 최종적으로 제곱근)
- 제곱 (S) : 모든 수를 제곱하여 부호를 없앤다.
- 평균 (M) : 제곱된 값들의 평균을 구한다.
- 제곱근 (R) : 제곱-평균된 값에 제곱근을 취한다.
표준편차
- 표준편차(SD)는 “평균으로부터의 편차들”의 RMS와 “대략” 비슷 (편차들에 대해 적용한 RMS)
- 다만 중간에 있는 M을 계산할때 1을빼서 계산 (CF. 이것과 관계있는 개념이 자유도)
- 표준편차는 관측치들이 평균으로부터 얼마나 떨어져 있는지 알려줌
- 평균값을 중심으로 평균적으로 s만큼 퍼져 있다는 의미
- 만약 어떤 집단의 평균값이 3이고 표준편차가 1.5라면, 좌우로 1.5(1.5 ~ 4.5)정도 퍼져있다는 것.
- 68-95법칙
- 관측치들의 약 68% 정도가 평균으로부터 1 표준편차 이내로 떨어져 있다.
- 관측치들의 약 95% 정도가 평균으로부터 2 표준편차 이내로 떨어져 있다.
자유도 (degrees of freedom)
- 주어진 조건 하에서 자유롭게 변화할 수 있는 개수
- 자유도는 합쳐진 값들 중에서 실질적으로 독립인 값들의 개수
- 표준편차 계산하는 경우의 자유도는 ”자료의 개수 - 1”
- 표준편차 계산의 대상이 되는 편차들의 합은 0이 됨. 편차들의 합이 0이 된다 는 하나의 제약조건이 자유도를 1만큼 감소시킨 것
EX) 극단적으로 자료의 개수가 하나인 경우
- 편차는 단 하나뿐이고 그 값은 0임
- 0에 대해 제곱의 평균(MS(mean square))를 계산할 때 자유도를 고려하지 않으면 0/1=0이지만, 자유도를 고려하면 0/(1-1)=0/0으로 부정형(indefinite form)이 됨
- 즉, 단 하나의 자료만을 가지고는 퍼진 정도를 알 수 없음. 이 때 퍼진 정도는 0이 아니 라 ‘알 수 없다(부정형)’가 정답임.
- 따라서, 자유도를 고려해야 함
표준편차와 관련된 정의
측정오차(measurement error)
- 관측치와 실제 값의 차이
- 측정오차가 존재하면, (관측치) = (실제 값) + (측정오차)
- 측정오차의 대략적인 크기는 관측치들의 표준편차(SD)를 통해 알 수 있음
- 표준편차(SD)의 크기는 한 번의 관측에서 측정오차가 어느 정도 될지 알려 줌
편의(bias)
- 방향성을 갖는 하나의 체계적인 오차
- 측정오차와 함께 편의가 있으면, (관측치)=(실제 값)+(편의)+(측정오차)
이탈값(outlier)
- 극단적인 관측치
해당포스팅은 류근관 교수님의 <그림과 수치를 이용한 자료의 정리>강의를 참고하여 작성하였습니다
728x90
반응형
'Statistics & Math > 기초통계학' 카테고리의 다른 글
[기초통계학] 산포도와 상관계수, 그리고 상관관계 (0) | 2024.03.20 |
---|---|
[기초통계학] 정규분포(표준정규분포, 표준화) (2) | 2024.03.14 |
[기초통계학] 데이터와 통계량 - 평균과 중앙값 (0) | 2024.03.12 |
[기초통계학] 실험연구와 경험적연구(자연실험) (0) | 2024.03.10 |
[기초통계학] 통계학과 자료 / 선택편향과 생존편향 (0) | 2024.03.10 |