Statistics & Math/기초통계학

[기초통계학] 지수분포(지수분포의 기댓값과 분산,지수분포의 무기억성)

YSY^ 2024. 2. 18. 19:21

지수분포(Exponential Distribution)

$E x p o (λ)$
연속확률분포의 일종
지수분포는 첫사건이 발생하는 데 걸리는 시간분포
사건이 서로 독립적일 때, 일정 시간 동안 발생하는 사건의 횟수가 푸아송 분포를 따른다면, 다음 사건이 일어날 때까지 대기 시간은 지수분포를 따름
모수 λ (rate parameter(비율 모수)- 속도를 나타내는 모수)

지수분포의 확률밀도함수 정의

$P D F : f (x) = λ e^{- λ x}, x > 0 (0 o t h e r w i s e)$
- 조건 확인: $\int_{0}^{\infty} λ e^{- λ x} d x = 1$
- e는 자연상수를 의미

[기초통계학] 지수분포(지수분포의 기댓값과 분산,지수분포의 무기억성) 0

지수분포의 누적분포함수

λ는 평균속도이므로, $\frac{1}{λ}$ 시간 간격으로 일어나는 사건이 x시간 안에 일어날 확률은 누적분포함수로 표현
CDF: $F (x) = \int_{0}^{x} λ e^{- λ t} d t = 1 - e^{- λ x}, x > 0$

사건이 x시간 이후에 일어날 확률인 경우

기댓값과 분산

$Y = λ X 일 때, Y \sim E x p o (1)$ 이다.

proof) Y의 CDF: $P (Y \leq y) = P (X \leq \frac{y}{λ}) = 1 - e^{- y} P (Y \leq y)$

$∴ Y \sim E x p o (1)$

$E (Y) = \int_{0}^{\infty} y e^{- y} d y$

$u = y, d v = e^{- y} d y, d u = d y, v = - e^{- y}$

= $[(- y e^{- y})]_{0}^{\infty} + \int_{0}^{\infty} e^{- y} d y = 1$

$V a r (Y) = E (Y^{2}) - {E (Y)}^{2} = \int_{0}^{\infty} y^{2} e^{- y} d y - 1 =$

$X = \frac{Y}{λ} \to E (X) = \frac{1}{λ}$

$V a r (X) = \frac{1}{λ^{2}}$

지수분포의 특징

기하분포로부터 파생된 분포
- 기하분포는 사건이 발생하기까지의 시도 횟수를 모델링하는 분포이며, 지수분포는 사건이 발생하기까지의 시간을 모델링함
지수분포는 무기억성분포
- 즉, 이전 사건이 발생한 시간과 관계없이 다음 사건이 발생하는 시간 간격은 독립적으로 분포

지수분포의 무기억성(memoryless property)

조건부확률을 이용해서 확인
$P (X \geq s + t | X \geq s) = P (X \geq t)$
- s의 경우 큰 의미가 없음 (s초만큼 지났다고 하더라도 t초를 더 기다리는 확률은 이미 기다린 s초와는 상관이 없다는 뜻)

proof) $P (X \geq s) = 1 - P (X \leq s) = e^{- λ s}$ ⋯ (생존함수)

$P (X \geq s + t | X \geq s) = \frac{P (X \geq s + t, X \geq s)}{P (X \geq s)}$
- 분자의 $P (X \geq s)$ 는 의미가 없음. s와 t가 음수가 아닌 실수라면 당연히 s보다 s+t가 크기 때문

$= \frac{e^{- λ (s + t)}}{e^{- λ s}} = e^{- λ t} = P (X \geq t) = P (X \geq t)$

연속확률분포에서 무기억성이 있는 분포는 지수분포만 있는 이유

이산확률분포는 기하분포, 연속확률분포는 지수분포에서만 적용됨.
연속확률변수 X가 무기억성이 있으면 $X \sim E x p o (λ)$

proof) X의 CDF $F \to G (x) = P (X \geq x) = 1 - F (x)$ 라 할 때,

$G (s + t) = G (s) G (t) G (s + t) = G (s) G (t)$ ⋯ 무기억성

s=t라 하였을 때
$G (2 t) = G (t)^{2}$
$G (3 t) = G (2 t) G (t) = G (t)^{3}$

⋯

$G (k t) = G (t)^{k}$ (k는 양의 정수)

$G (\frac{t}{2}) = \sqrt{G (t)}$

$G (\frac{t}{3}) = G (t)^{1 / 3}$

$G (\frac{t}{k}) = G (t)^{1 / k}$

$G (\frac{m t}{n}) = G (t)^{m / n}$

$\Rightarrow G (x t) = G (t)^{x}$
for all real x>0

$t = 1 일 때, G (x) = G (1)^{x} = e^{x l n G (1)} = e^{- λ x}$
→ 1- 지수분포의 CDF

조건부 기댓값(conditional expectation)

$E (X | X > a) = a + E (X - a | X > a)$
⋯(X−a는 a만큼 기다린 후 남은 대기시간. 무기억성에 의해 새로운 지수분포가 된다)

$= a + \frac{1}{λ}$

728x90

저작자표시 비영리

'Statistics & Math > 기초통계학' 카테고리의 다른 글

[기초통계학] 변수(질적변수/양적변수/독립변수/종속변수/통제변수)와 척도 (명목/순서/간격/비율) (0)	2024.03.10
[기초통계학] 표본 분포와 중심극한정리 (0)	2024.03.02
[기초통계학] 확률밀도함수 (연속확률분포, 균등분포) (1)	2024.01.06
[기초통계학] 포아송분포(poisson distribution) (2)	2023.12.31
[기초통계학] 가설검정과 P값 (p-value) (2)	2023.12.31

현재글[기초통계학] 지수분포(지수분포의 기댓값과 분산,지수분포의 무기억성)

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

[기초통계학] 지수분포(지수분포의 기댓값과 분산,지수분포의 무기억성)

지수분포(Exponential Distribution)

기댓값과 분산

지수분포의 특징

지수분포의 무기억성(memoryless property)

연속확률분포에서 무기억성이 있는 분포는 지수분포만 있는 이유

조건부 기댓값(conditional expectation)

'Statistics & Math > 기초통계학' 카테고리의 다른 글

'Statistics & Math/기초통계학'의 다른글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

[기초통계학] 지수분포(지수분포의 기댓값과 분산,지수분포의 무기억성)

지수분포(Exponential Distribution)

기댓값과 분산

지수분포의 특징

지수분포의 무기억성(memoryless property)

연속확률분포에서 무기억성이 있는 분포는 지수분포만 있는 이유

조건부 기댓값(conditional expectation)

'Statistics & Math > 기초통계학' 카테고리의 다른 글

'Statistics & Math/기초통계학'의 다른글

관련글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역