Statistics & Math/기초통계학

[기초통계학] 포아송분포(poisson distribution)

YSY^ 2023. 12. 31. 22:02

포아송분포(poisson distribution) (푸아송분포)

낮은 확률로 일어나는 무작위 사건에 대해 평균이 $λ$ 일때 몇 번(k) 일어나는지를 나타내는 확률분포
- ex) 한 시간 동안 오는 이메일의 갯수
이항분포의 특수한 경우이며, 시행횟수가 무수히 많아지고 발생확률은 아주 작은 경우
$X \sim P o i s (λ)$ 로 표현

포아송 분포 공식 : $P (X = k) = \frac{e^{- λ} λ^{k}}{k!}$ $(k \in 0, 1, 2, . . .)$

이항분포는 0부터 n까지 k의 범위가 정해져 있지만 포아송에서는 음수가 아닌 모든 정수가 가능함.
λ는 (속도를 나타내는) 모수(비율모수)로, λ>0 인 상수이다.
- 평균을 나타내며 동시에 분산이기도함. 뜩 평균과 분산이 독립이 아니라는 특징이 있음
- 즉, 평균λ가 커질수록 분포의 넓이도 커짐
조건 확인: $\sum_{k = 0}^{\infty} \frac{e^{- λ} λ^{k}}{k!} = e^{- λ} e^{λ} = 1$
- $\sum_{k = 0}^{\infty} \frac{λ^{k}}{k!}$ 는 테일러 급수에 따라 $e^{λ}$ 로 치환된다
- 즉 확률의 합이 1이 되는 것을 확인할 수 있다.

[기초통계학] 포아송분포(poisson distribution) 0 — 포아송 분포에 대한 설명

CF) 테일러 급수

f(x)의 테일러 급수는 아래와 같다

a=0인 경우는 매클로린 급수라고 한다.

여기서 $e^{λ}$ 의 매클로린 급수는 아래와 같다

x에 $λ$ 를 대입하면 아래와 같다.
$e^{λ} = \sum_{n = 0}^{\infty} \frac{λ^{n}}{n!}$

포아송분포의 평균

기대값은 값과 확률의 곱의 합
$E (X) = e^{- λ} \sum_{k = 0}^{\infty} k \frac{λ^{k}}{k!}$ = $λ e^{- λ} \sum_{k = 1}^{\infty} \frac{λ^{k - 1}}{(k - 1)!}$ = $e^{- λ} \sum_{k = 1}^{\infty} \frac{λ^{k}}{(k - 1)!}$
= $λ e^{- λ} e^{λ} = λ$ (테일러 급수 정리활용)

포아송분포의 분산

$E (X^{2}) = \sum_{k = 0}^{\infty} k^{2} e^{- λ} λ^{k} / k!$ $λ \sum_{k = 1}^{\infty} \frac{k λ^{k - 1}}{k!}$ $\sum_{k = 0}^{\infty} \frac{k^{2} λ^{k - 1}}{k!} = λ e^{λ} + e^{λ} = e^{λ} (λ + 1)$
$= e^{- λ} e^{λ} (λ + 1) λ = λ^{2} + λ$
$= \sum_{k = 1}^{\infty} \frac{k λ^{k}}{k!} = λ e^{λ}$
$\sum_{k = 0}^{\infty} \frac{λ^{k}}{k!} = e^{λ}$
$V a r (X) = E (X^{2}) - {E (X)}^{2} = λ^{2} + λ - λ^{2} = λ$

포아송분포의 활용

수를 세는 응용에서 쓰임 (성공의 수를 세는 응용의 수)
이항분포처럼 성공은 정의하기 나름이고, 수많은 시도가 기반이 되며 각 시도의 성공확률은 극히 낮아야함
예시
1) 한 시간 동안 오는 이메일의 갯수 (수많은 사람이 당신에게 이메일을 보낼 수 있음. 즉 각 사람마다 한시간안에 당신에게 이메일을 보낼 확률은 극히 낮음)
2) 특정 지역에서의 1년간 지진 발생 수
3) 일정 주어진 시간 동안에 도착한 고객의 수
4) 1킬로미터 도로에 있는 흠집의 수
4) 일정 주어진 생산시간 동안 발생하는 불량 수
5) 하룻동안 발생하는 출생자 수
6) 어떤 시간 동안 톨게이트를 통과하는 차량의 수
7) 길바닥에 빗방울이 떨어지는 횟수
- 각 사각형에 빗방울이 떨어지는 사건은 이항분포이지만, 그 사건은 서로 독립임.
  - 빗방울은 많이 떨어지지만 한 사각형 안에 떨어질 확률은 작기 때문에, 포아송 분포로도 볼 수 있음
위 예시들은 완벽한 포아송 분포가 아니지만 추정하기 유용한 분포임

포아송근사(poisson approximation)

poisson paradigm이라고도 부름
어떤 큰 숫자 n에 대하여 $A_{1}, . . ., A_{n}$ 의 사건들이 각각 $P (A_{j}) = p_{j}$ 라는 낮은 확률로 발생하고, 각 사건은 독립(이거나 weakly dependent)일 때, 발생하는 사건( $A_{j}$ )의 수는 $P o i s (λ)$ 의 분포를 따른다.
- $λ = \sum p_{j}$
또한 $\sim B i n (n, p)$ 는 n→∞ , p→0 하고 np=λ 가 상수로 유지될 때 (n과 p가 증가하는 속도가 같음) 이항확률변수 X의 분포는 포아송에 근사하게 된다.
증명)
$P (X = k) = (\binom{n}{k}) p^{k} (1 - p)^{n - k}$ 이고 $p = \frac{λ}{n}$ 로 놓았을 때,
= $\frac{n (n - 1) . . . (n - k + 1)}{k!} \cdot (\frac{λ}{n})^{k} \cdot (1 - \frac{λ}{n})^{n - k}$
= $\frac{n (n - 1) . . . (n - k + 1) λ^{k}}{k! n^{k}} \cdot (1 - \frac{λ}{n})^{n} \cdot (1 - \frac{λ}{n})^{- k}$ $\frac{n (n - 1) . . . (n - k + 1)}{n^{k}} \to 1, (1 - \frac{λ}{n})^{- k} \to 1, (1 - \frac{λ}{n})^{n} \to e^{- λ}$ 이므로
$\Rightarrow P (X = k) \to \frac{λ^{k}}{k!} \cdot e^{- λ}$
이고 n→∞ 에 따라 $\Rightarrow P (X = k) \to \frac{λ^{k}}{k!} \cdot e^{- λ}$
$\frac{n (n - 1) . . . (n - k + 1)}{n^{k}} \to 1, (1 - \frac{λ}{n})^{- k} \to 1, (1 - \frac{λ}{n})^{n} \to e^{- λ}$ 이므로

728x90

저작자표시 비영리 변경금지

'Statistics & Math > 기초통계학' 카테고리의 다른 글

[기초통계학] 지수분포(지수분포의 기댓값과 분산,지수분포의 무기억성) (0)	2024.02.18
[기초통계학] 확률밀도함수 (연속확률분포, 균등분포) (1)	2024.01.06
[기초통계학] 가설검정과 P값 (p-value) (2)	2023.12.31
[기초통계학] 기하분포와 음이항분포 (0)	2023.12.25
[기초통계학] 기댓값 (Expected Value) (1)	2023.12.17

현재글[기초통계학] 포아송분포(poisson distribution)

YSY의 데이터분석 블로그 데이터 분석 블로그 - 데이터분석 방법론 / 인과추론 / 머신러닝 / Python / SQL / Hadoop&Spark / 통계

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

[기초통계학] 포아송분포(poisson distribution)

포아송분포(poisson distribution) (푸아송분포)

포아송분포의 평균

포아송분포의 분산

포아송분포의 활용

포아송근사(poisson approximation)

'Statistics & Math > 기초통계학' 카테고리의 다른 글

'Statistics & Math/기초통계학'의 다른글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

[기초통계학] 포아송분포(poisson distribution)

포아송분포(poisson distribution) (푸아송분포)

포아송분포의 평균

포아송분포의 분산

포아송분포의 활용

포아송근사(poisson approximation)

'Statistics & Math > 기초통계학' 카테고리의 다른 글

'Statistics & Math/기초통계학'의 다른글

관련글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역