Statistics & Math/기초통계학

[기초통계학] 확률밀도함수 (연속확률분포, 균등분포)

YSY^ 2024. 1. 6. 23:47

확률밀도함수(Probability Density Function) (PDF)

  • 확률변수 X가 모든 a,b 에 대하여 P(aXb)=abf(x)dx 를 만족시킬 때, X는 확률밀도함수(PDF) f(x)를 갖는다.
  • a=b 인 경우, aaf(x)dx=0
  • 확률밀도함수가 필요한 이유는 P(X=x) = 0이기 때문 (특정값에 대한 확률은 0)
    • 0과 1사이에는 수많은 실수가 존재함 -> 확률질량함수에서는 이 모든 실수에 대한 확률이 0임
    • 따라서 확률밀도함수는 값에 일정한 범위를 두고 확률을 계산
  • 확률밀도함수에도 누적분포함수(CDF)가 존재
  • 확률밀도함수의 세로축은 확률 그 자체의 값이 아니라 상대적 발생 가능성을 표현한 것임
  • 조건: f(x)0,f(x)dx=1
  • 즉, 확률변수의 정의역 전체를 적분하면 1이 되며, 모든 사건 중 어느 것이든 일어날 확률이 1이라는 것을 나타냄

[기초통계학] 확률밀도함수 (연속확률분포, 균등분포) 0
확률밀도함수

밀도란

  • 확률밀도함수는 확률을 의미하는 것이 아니라 확률밀도를 의미하는 것임
  • f(x0)ϵP(X(x0ϵ/2,x0+ϵ/2))
    • 매우 작은 양의 값 ϵ 길이의 구간에 대한 면적
  • X가 PDF f를 가질 때, CDF는 F(x)=P(Xx)=xf(x)dx 이다.
  • CF) <미적분학의 기본정리(Fundamental Theorem of Calculus)> <'FTC'>
    • 상한이 정해지지 않은 적분이 있을때 F(x)값을 아는 것은 이를 미분을 하는 것이다.
    • 정적분을 하고 싶으면 역도함수를 구해서 하한과 상한에서 그 역도함수를 빼는 것이다.
  • X가 CDF FX(x)를 가질 때, PDF는 f(x)=FX(x)이다 <FTC>
  • P(aXb)=abf(x)dx=F(b)F(a) <FTC>
  • 참고로 P(aXb)가 a,b를 포함하는지 안하는지는 중요하지 않음

연속확률분포(continuous distribution)와 이산확률분포 비교

이산 확률 분포 연속확률분포
확률함수 PMF(확률질량함수) P(X=x) PDF(확률밀도함수) fX(x)(P(X=x)=0)
CDF(누적분포함수) FX(x)=P(Xx)
기댓값 E(X)=xxP(X=x) xfX(x)dx
분산 Var(X)=E(Y2)E(Y)2
표준편차 sd(X)=Var(X)

균등분포(uniform distribution) Unif(a,b)

  • 연속확률분포의 한 종류로, 모든 확률변수에 대해 균일한 확률을 가짐
  • 특정 범위가 뽑힐 확률이 그 범위의 크기에 비례하는 분포
  • 두개의 매개변수 a,b를 받으며, [a,b] 범위에서 균등한 확률을 가짐

[기초통계학] 확률밀도함수 (연속확률분포, 균등분포) 1

  • PDF f(X)=c(aXb) (=0 otherwise)
    • 확률밀도를 적분하면 1이 나와야함
      1=abcdx=c(ba)
      c=1ba
  • CDF F(X)=xf(t)dt=abf(t)dt=0(x<a)1(x>b)
  • xaba(axb)
  • 기댓값
    E(X)=abxbadx=x22(ba)]ab
    =12(ba)(ba)(b+a)=a+b2
  • 분산
    Var(X)=E(Y2)E(Y)2=x2fX(x)dx
    (-> 무의식 통계학자의 법칙(Law of unconscious statistician))
  • E(g(X))=g(x)fX(x)dx (이게 맞음)

표준연속균등분포

UUnif(0,1) 이라 할 때,

E(U)=12,E(U2)=01u2fU(u)du=13

Var(U)=E(U2)E(U)2=1314=112

균등분포의 보편성(universality of the uniform distribution)

  • Unif(0,1) 를 통하여 모든 확률분포를 만들어낼 수 있다.

UUnif(0,1), CDF F를 가질 때 (F는 연속인 증가함수이라고 가정)

정리) X=F1(U),XF

증명) P(Xx)=P(F1(U)x)=P(UF(x))

균등분포의 보편성 (cont.)

  • F가 증가하는 CDF라고 할 때,
    UUnif(0,1) 이면 X1(U)이다. → 어떤 확률분포를 simulate 할 때 유용한 성질

XFF(X)Unif(0,1)이다.

ex) F(x)=1ex(x>0)를 따르는 X 분포를 simulate하기 위해서는

  1. UUnif(0,1)를 simulate한다

  2. F1(U)=ln(1U)F

균등분포의 대칭성

UUnif(0,1)일 때, 1UUnif(0,1)이다.

균등분포의 선형변환

UUnif(0,1)일 때, a+bUUnif(a,a+b)이다.

(비선형적 변환 시 더 이상 균등분포를 따르지 않는다)

해당 포스팅은 [하버드 확률론 기초] 강의를 참고하여 작성하였습니다

728x90
반응형