포아송분포(poisson distribution) (푸아송분포)
- 낮은 확률로 일어나는 무작위 사건에 대해 평균이
일때 몇 번(k) 일어나는지를 나타내는 확률분포- ex) 한 시간 동안 오는 이메일의 갯수
- 이항분포의 특수한 경우이며, 시행횟수가 무수히 많아지고 발생확률은 아주 작은 경우
로 표현
포아송 분포 공식 :
- 이항분포는 0부터 n까지 k의 범위가 정해져 있지만 포아송에서는 음수가 아닌 모든 정수가 가능함.
- λ는 (속도를 나타내는) 모수(비율모수)로, λ>0 인 상수이다.
- 평균을 나타내며 동시에 분산이기도함. 뜩 평균과 분산이 독립이 아니라는 특징이 있음
- 즉, 평균λ가 커질수록 분포의 넓이도 커짐
- 조건 확인:
는 테일러 급수에 따라 로 치환된다- 즉 확률의 합이 1이 되는 것을 확인할 수 있다.
![[기초통계학] 포아송분포(poisson distribution) 0](http://t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png)
CF) 테일러 급수
f(x)의 테일러 급수는 아래와 같다
![[기초통계학] 포아송분포(poisson distribution) 1](http://t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png)
a=0인 경우는 매클로린 급수라고 한다.
![[기초통계학] 포아송분포(poisson distribution) 2](http://t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png)
여기서
![[기초통계학] 포아송분포(poisson distribution) 3](http://t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png)
x에
포아송분포의 평균
- 기대값은 값과 확률의 곱의 합
= =- =
(테일러 급수 정리활용)
포아송분포의 분산
포아송분포의 활용
- 수를 세는 응용에서 쓰임 (성공의 수를 세는 응용의 수)
- 이항분포처럼 성공은 정의하기 나름이고, 수많은 시도가 기반이 되며 각 시도의 성공확률은 극히 낮아야함
- 예시
1) 한 시간 동안 오는 이메일의 갯수 (수많은 사람이 당신에게 이메일을 보낼 수 있음. 즉 각 사람마다 한시간안에 당신에게 이메일을 보낼 확률은 극히 낮음)
2) 특정 지역에서의 1년간 지진 발생 수
3) 일정 주어진 시간 동안에 도착한 고객의 수
4) 1킬로미터 도로에 있는 흠집의 수
4) 일정 주어진 생산시간 동안 발생하는 불량 수
5) 하룻동안 발생하는 출생자 수
6) 어떤 시간 동안 톨게이트를 통과하는 차량의 수
7) 길바닥에 빗방울이 떨어지는 횟수- 각 사각형에 빗방울이 떨어지는 사건은 이항분포이지만, 그 사건은 서로 독립임.
- 빗방울은 많이 떨어지지만 한 사각형 안에 떨어질 확률은 작기 때문에, 포아송 분포로도 볼 수 있음
- 각 사각형에 빗방울이 떨어지는 사건은 이항분포이지만, 그 사건은 서로 독립임.
- 위 예시들은 완벽한 포아송 분포가 아니지만 추정하기 유용한 분포임
포아송근사(poisson approximation)
- poisson paradigm이라고도 부름
- 어떤 큰 숫자 n에 대하여
의 사건들이 각각 라는 낮은 확률로 발생하고, 각 사건은 독립(이거나 weakly dependent)일 때, 발생하는 사건( )의 수는 의 분포를 따른다. - 또한
는 n→∞ , p→0 하고 np=λ 가 상수로 유지될 때 (n과 p가 증가하는 속도가 같음) 이항확률변수 X의 분포는 포아송에 근사하게 된다. - 증명)
이고 로 놓았을 때,
=
= 이므로
- 이고 n→∞ 에 따라
이므로
728x90
반응형
'Statistics & Math > 기초통계학' 카테고리의 다른 글
[기초통계학] 지수분포(지수분포의 기댓값과 분산,지수분포의 무기억성) (0) | 2024.02.18 |
---|---|
[기초통계학] 확률밀도함수 (연속확률분포, 균등분포) (1) | 2024.01.06 |
[기초통계학] 가설검정과 P값 (p-value) (2) | 2023.12.31 |
[기초통계학] 기하분포와 음이항분포 (0) | 2023.12.25 |
[기초통계학] 기댓값 (Expected Value) (1) | 2023.12.17 |