지수분포(Exponential Distribution)
- $Expo(\lambda)$
- 연속확률분포의 일종
- 지수분포는 첫사건이 발생하는 데 걸리는 시간분포
- 사건이 서로 독립적일 때, 일정 시간 동안 발생하는 사건의 횟수가 푸아송 분포를 따른다면, 다음 사건이 일어날 때까지 대기 시간은 지수분포를 따름
- 모수 λ (rate parameter(비율 모수)- 속도를 나타내는 모수)
- 지수분포의 확률밀도함수 정의
- $PDF: f(x) = \lambda e^{-\lambda x}, x>0 (0 otherwise)$
- 조건 확인: $\displaystyle \int ^\infty _0 \lambda e^{-\lambda x} dx = 1$
- e는 자연상수를 의미
- 지수분포의 누적분포함수
- λ는 평균속도이므로, $ \frac{1}{\lambda}$ 시간 간격으로 일어나는 사건이 x시간 안에 일어날 확률은 누적분포함수로 표현
- CDF: $F(x) = \displaystyle \int ^x _0 \lambda e ^{-\lambda t}dt= 1-e^{- \lambda x}, x>0$
- 사건이 x시간 이후에 일어날 확률인 경우
기댓값과 분산
$Y = \lambda X일 때, Y \sim Expo(1)$이다.
proof) Y의 CDF: $P(Y \le y) = P(X \le \displaystyle \frac{y}{\lambda}) = 1- e^{-y}P(Y≤y)$
$\therefore Y \sim Expo(1)$
$E(Y) = \displaystyle \int^\infty _0 ye^{-y}dy$
$u = y, dv = e^{-y}dy, du = dy, v = -e^{-y}$
= $\large [(-ye^{-y})]^\infty _0 + \displaystyle \int^\infty _0 e^{-y}dy = 1$
$Var(Y) = E(Y^2)-{E(Y)}^2 = \displaystyle \int^\infty_0y^2e^{-y}dy -1 =$
$ X = \Large \frac{Y}{\lambda} \rightarrow E(X) = \Large \frac{1}{\lambda}$
$Var(X) = \Large\frac{1}{\lambda^2}$
지수분포의 특징
- 기하분포로부터 파생된 분포
- 기하분포는 사건이 발생하기까지의 시도 횟수를 모델링하는 분포이며, 지수분포는 사건이 발생하기까지의 시간을 모델링함
- 지수분포는 무기억성분포
- 즉, 이전 사건이 발생한 시간과 관계없이 다음 사건이 발생하는 시간 간격은 독립적으로 분포
지수분포의 무기억성(memoryless property)
- 조건부확률을 이용해서 확인
- $P(X \ge s+t|X \ge s) = P(X \ge t)$
- s의 경우 큰 의미가 없음 (s초만큼 지났다고 하더라도 t초를 더 기다리는 확률은 이미 기다린 s초와는 상관이 없다는 뜻)
proof) $P(X \ge s)= 1- P(X \le s) = e^{-\lambda s}$ ⋯ (생존함수)
$P(X \ge s+t|X \ge s) = \displaystyle \frac{P(X \ge s+t, X\ge s)}{P(X \ge s)}$
- 분자의 $P(X\ge s)$는 의미가 없음. s와 t가 음수가 아닌 실수라면 당연히 s보다 s+t가 크기 때문
$= \frac{e^{-\lambda (s+t)}}{e^{-\lambda s}} = e^{-\lambda t} = P(X\ge t)=P(X≥t)$
연속확률분포에서 무기억성이 있는 분포는 지수분포만 있는 이유
- 이산확률분포는 기하분포, 연속확률분포는 지수분포에서만 적용됨.
- 연속확률변수 X가 무기억성이 있으면 $X \sim Expo(\lambda)$
proof) X의 CDF $F \rightarrow G(x) = P(X \ge x) = 1-F(x)$라 할 때,
$G(s+t) = G(s)G(t)G(s+t)=G(s)G(t)$ ⋯ 무기억성
s=t라 하였을 때
$G(2t) = G(t)^2$
$G(3t) = G(2t)G(t)=G(t)^3$
⋯
$G(kt) = G(t)^k$ (k는 양의 정수)
$G(\large \frac{t}{2}) = \sqrt {G(t)}$
$G(\large \frac{t}{3}) = G(t)^{1/3}$
$G(\large \frac{t}{k})= G(t)^{1/k}$
$G(\large \frac{mt}{n}) = G(t)^{m/n}$
$\Rightarrow G(xt) = G(t)^x$
for all real x>0
$t=1일 때, G(x) = G(1)^x = \large e^{xlnG(1)} =e^{-\lambda x}$
→ 1- 지수분포의 CDF
조건부 기댓값(conditional expectation)
$E(X|X > a) = a+E(X-a|X >a)$
⋯(X−a는 a만큼 기다린 후 남은 대기시간. 무기억성에 의해 새로운 지수분포가 된다)
$= a + \displaystyle \frac{1}{\lambda}$
'Statistics & Math > 기초통계학' 카테고리의 다른 글
[기초통계학] 변수(질적변수/양적변수/독립변수/종속변수/통제변수)와 척도 (명목/순서/간격/비율) (0) | 2024.03.10 |
---|---|
[기초통계학] 표본 분포와 중심극한정리 (0) | 2024.03.02 |
[기초통계학] 확률밀도함수 (연속확률분포, 균등분포) (1) | 2024.01.06 |
[기초통계학] 포아송분포(poisson distribution) (2) | 2023.12.31 |
[기초통계학] 가설검정과 P값 (p-value) (2) | 2023.12.31 |