Statistics & Math/기초통계학

[기초통계학] 지수분포(지수분포의 기댓값과 분산,지수분포의 무기억성)

YSY^ 2024. 2. 18. 19:21

지수분포(Exponential Distribution)

  • $Expo(\lambda)$
  • 연속확률분포의 일종
  • 지수분포는 첫사건이 발생하는 데 걸리는 시간분포
  • 사건이 서로 독립적일 때, 일정 시간 동안 발생하는 사건의 횟수가 푸아송 분포를 따른다면, 다음 사건이 일어날 때까지 대기 시간은 지수분포를 따름
  • 모수 λ (rate parameter(비율 모수)- 속도를 나타내는 모수)
  1. 지수분포의 확률밀도함수 정의
  • $PDF: f(x) = \lambda e^{-\lambda x}, x>0 (0 otherwise)$
    • 조건 확인: $\displaystyle \int ^\infty _0 \lambda e^{-\lambda x} dx = 1$
    • e는 자연상수를 의미

  1. 지수분포의 누적분포함수
  • λ는 평균속도이므로, $ \frac{1}{\lambda}$ 시간 간격으로 일어나는 사건이 x시간 안에 일어날 확률은 누적분포함수로 표현
  • CDF: $F(x) = \displaystyle \int ^x _0 \lambda e ^{-\lambda t}dt= 1-e^{- \lambda x}, x>0$
  1. 사건이 x시간 이후에 일어날 확률인 경우

기댓값과 분산

$Y = \lambda X일 때, Y \sim Expo(1)$이다.

proof) Y의 CDF: $P(Y \le y) = P(X \le \displaystyle \frac{y}{\lambda}) = 1- e^{-y}P(Y≤y)$

$\therefore Y \sim Expo(1)$

$E(Y) = \displaystyle \int^\infty _0 ye^{-y}dy$

$u = y, dv = e^{-y}dy, du = dy, v = -e^{-y}$

= $\large [(-ye^{-y})]^\infty _0​ + \displaystyle \int^\infty _0 e^{-y}dy = 1$

$Var(Y) = E(Y^2)-{E(Y)}^2 = \displaystyle \int^\infty_0y^2e^{-y}dy -1 =$

$ X = \Large \frac{Y}{\lambda} \rightarrow E(X) = \Large \frac{1}{\lambda}$

$Var(X) = \Large\frac{1}{\lambda^2}$

지수분포의 특징

  • 기하분포로부터 파생된 분포
    • 기하분포는 사건이 발생하기까지의 시도 횟수를 모델링하는 분포이며, 지수분포는 사건이 발생하기까지의 시간을 모델링함
  • 지수분포는 무기억성분포
    • 즉, 이전 사건이 발생한 시간과 관계없이 다음 사건이 발생하는 시간 간격은 독립적으로 분포

지수분포의 무기억성(memoryless property)

  • 조건부확률을 이용해서 확인
  • $P(X \ge s+t|X \ge s) = P(X \ge t)$
    • s의 경우 큰 의미가 없음 (s초만큼 지났다고 하더라도 t초를 더 기다리는 확률은 이미 기다린 s초와는 상관이 없다는 뜻)

proof) $P(X \ge s)= 1- P(X \le s) = e^{-\lambda s}$ ⋯ (생존함수)

$P(X \ge s+t|X \ge s) = \displaystyle \frac{P(X \ge s+t, X\ge s)}{P(X \ge s)}$
- 분자의 $P(X\ge s)$는 의미가 없음. s와 t가 음수가 아닌 실수라면 당연히 s보다 s+t가 크기 때문

$= \frac{e^{-\lambda (s+t)}}{e^{-\lambda s}} = e^{-\lambda t} = P(X\ge t)=P(X≥t)$

연속확률분포에서 무기억성이 있는 분포는 지수분포만 있는 이유
  • 이산확률분포는 기하분포, 연속확률분포는 지수분포에서만 적용됨.
  • 연속확률변수 X가 무기억성이 있으면 $X \sim Expo(\lambda)$

proof) X의 CDF $F \rightarrow G(x) = P(X \ge x) = 1-F(x)$라 할 때,

$G(s+t) = G(s)G(t)G(s+t)=G(s)G(t)$ ⋯ 무기억성

s=t라 하였을 때
$G(2t) = G(t)^2$
$G(3t) = G(2t)G(t)=G(t)^3$

$G(kt) = G(t)^k$ (k는 양의 정수)

$G(\large \frac{t}{2}) = \sqrt {G(t)}$

$G(\large \frac{t}{3}) = G(t)^{1/3}$
​​

$G(\large \frac{t}{k})= G(t)^{1/k}$

$G(\large \frac{mt}{n}) = G(t)^{m/n}$

$\Rightarrow G(xt) = G(t)^x$
​​ for all real x>0

$t=1일 때, G(x) = G(1)^x = \large e^{xlnG(1)} =e^{-\lambda x}$
​​ → 1- 지수분포의 CDF

조건부 기댓값(conditional expectation)

$E(X|X > a) = a+E(X-a|X >a)$
⋯(X−a는 a만큼 기다린 후 남은 대기시간. 무기억성에 의해 새로운 지수분포가 된다)

$= a + \displaystyle \frac{1}{\lambda}$

728x90
반응형