Statistics & Math/기초통계학

[기초통계학] 지수분포(지수분포의 기댓값과 분산,지수분포의 무기억성)

YSY^ 2024. 2. 18. 19:21

지수분포(Exponential Distribution)

  • Expo(λ)
  • 연속확률분포의 일종
  • 지수분포는 첫사건이 발생하는 데 걸리는 시간분포
  • 사건이 서로 독립적일 때, 일정 시간 동안 발생하는 사건의 횟수가 푸아송 분포를 따른다면, 다음 사건이 일어날 때까지 대기 시간은 지수분포를 따름
  • 모수 λ (rate parameter(비율 모수)- 속도를 나타내는 모수)
  1. 지수분포의 확률밀도함수 정의
  • PDF:f(x)=λeλx,x>0(0otherwise)
    • 조건 확인: 0λeλxdx=1
    • e는 자연상수를 의미

[기초통계학] 지수분포(지수분포의 기댓값과 분산,지수분포의 무기억성) 0

  1. 지수분포의 누적분포함수
  • λ는 평균속도이므로, 1λ 시간 간격으로 일어나는 사건이 x시간 안에 일어날 확률은 누적분포함수로 표현
  • CDF: F(x)=0xλeλtdt=1eλx,x>0
  1. 사건이 x시간 이후에 일어날 확률인 경우

[기초통계학] 지수분포(지수분포의 기댓값과 분산,지수분포의 무기억성) 1
[기초통계학] 지수분포(지수분포의 기댓값과 분산,지수분포의 무기억성) 2

기댓값과 분산

Y=λX,YExpo(1)이다.

proof) Y의 CDF: P(Yy)=P(Xyλ)=1eyP(Yy)

YExpo(1)

E(Y)=0yeydy

u=y,dv=eydy,du=dy,v=ey

= [(yey)]0+0eydy=1

Var(Y)=E(Y2)E(Y)2=0y2eydy1=

X=YλE(X)=1λ

Var(X)=1λ2

지수분포의 특징

  • 기하분포로부터 파생된 분포
    • 기하분포는 사건이 발생하기까지의 시도 횟수를 모델링하는 분포이며, 지수분포는 사건이 발생하기까지의 시간을 모델링함
  • 지수분포는 무기억성분포
    • 즉, 이전 사건이 발생한 시간과 관계없이 다음 사건이 발생하는 시간 간격은 독립적으로 분포

지수분포의 무기억성(memoryless property)

  • 조건부확률을 이용해서 확인
  • P(Xs+t|Xs)=P(Xt)
    • s의 경우 큰 의미가 없음 (s초만큼 지났다고 하더라도 t초를 더 기다리는 확률은 이미 기다린 s초와는 상관이 없다는 뜻)

proof) P(Xs)=1P(Xs)=eλs ⋯ (생존함수)

P(Xs+t|Xs)=P(Xs+t,Xs)P(Xs)
- 분자의 P(Xs)는 의미가 없음. s와 t가 음수가 아닌 실수라면 당연히 s보다 s+t가 크기 때문

=eλ(s+t)eλs=eλt=P(Xt)=P(Xt)

연속확률분포에서 무기억성이 있는 분포는 지수분포만 있는 이유
  • 이산확률분포는 기하분포, 연속확률분포는 지수분포에서만 적용됨.
  • 연속확률변수 X가 무기억성이 있으면 XExpo(λ)

proof) X의 CDF FG(x)=P(Xx)=1F(x)라 할 때,

G(s+t)=G(s)G(t)G(s+t)=G(s)G(t) ⋯ 무기억성

s=t라 하였을 때
G(2t)=G(t)2
G(3t)=G(2t)G(t)=G(t)3

G(kt)=G(t)k (k는 양의 정수)

G(t2)=G(t)

G(t3)=G(t)1/3
​​

G(tk)=G(t)1/k

G(mtn)=G(t)m/n

G(xt)=G(t)x
​​ for all real x>0

t=1,G(x)=G(1)x=exlnG(1)=eλx
​​ → 1- 지수분포의 CDF

조건부 기댓값(conditional expectation)

E(X|X>a)=a+E(Xa|X>a)
⋯(X−a는 a만큼 기다린 후 남은 대기시간. 무기억성에 의해 새로운 지수분포가 된다)

=a+1λ

728x90
반응형