Statistics & Math/기초통계학

[기초통계학] 포아송분포(poisson distribution)

YSY^ 2023. 12. 31. 22:02

포아송분포(poisson distribution) (푸아송분포)

  • 낮은 확률로 일어나는 무작위 사건에 대해 평균이 λ 일때 몇 번(k) 일어나는지를 나타내는 확률분포
    • ex) 한 시간 동안 오는 이메일의 갯수
  • 이항분포의 특수한 경우이며, 시행횟수가 무수히 많아지고 발생확률은 아주 작은 경우
  • XPois(λ) 로 표현

포아송 분포 공식 : P(X=k)=eλλkk! (k0,1,2,...)

  • 이항분포는 0부터 n까지 k의 범위가 정해져 있지만 포아송에서는 음수가 아닌 모든 정수가 가능함.
  • λ는 (속도를 나타내는) 모수(비율모수)로, λ>0 인 상수이다.
    • 평균을 나타내며 동시에 분산이기도함. 뜩 평균과 분산이 독립이 아니라는 특징이 있음
    • 즉, 평균λ가 커질수록 분포의 넓이도 커짐
  • 조건 확인: k=0eλλkk!=eλeλ=1
    • k=0λkk! 는 테일러 급수에 따라 eλ로 치환된다
    • 즉 확률의 합이 1이 되는 것을 확인할 수 있다.

[기초통계학] 포아송분포(poisson distribution) 0
포아송 분포에 대한 설명

CF) 테일러 급수

f(x)의 테일러 급수는 아래와 같다

[기초통계학] 포아송분포(poisson distribution) 1

a=0인 경우는 매클로린 급수라고 한다.

[기초통계학] 포아송분포(poisson distribution) 2

여기서 eλ의 매클로린 급수는 아래와 같다

[기초통계학] 포아송분포(poisson distribution) 3

x에 λ를 대입하면 아래와 같다.
eλ=n=0λnn!

포아송분포의 평균

  • 기대값은 값과 확률의 곱의 합
  • E(X)=eλk=0kλkk!= λeλk=1λk1(k1)!= eλk=1λk(k1)!
  • = λeλeλ=λ (테일러 급수 정리활용)

포아송분포의 분산

  • E(X2)=k=0k2eλλk/k!λk=1kλk1k!k=0k2λk1k!=λeλ+eλ=eλ(λ+1)
  • =eλeλ(λ+1)λ=λ2+λ
  • =k=1kλkk!=λeλ
  • k=0λkk!=eλ
  • Var(X)=E(X2)E(X)2=λ2+λλ2=λ

포아송분포의 활용

  • 수를 세는 응용에서 쓰임 (성공의 수를 세는 응용의 수)
  • 이항분포처럼 성공은 정의하기 나름이고, 수많은 시도가 기반이 되며 각 시도의 성공확률은 극히 낮아야함
  • 예시
    1) 한 시간 동안 오는 이메일의 갯수 (수많은 사람이 당신에게 이메일을 보낼 수 있음. 즉 각 사람마다 한시간안에 당신에게 이메일을 보낼 확률은 극히 낮음)
    2) 특정 지역에서의 1년간 지진 발생 수
    3) 일정 주어진 시간 동안에 도착한 고객의 수
    4) 1킬로미터 도로에 있는 흠집의 수
    4) 일정 주어진 생산시간 동안 발생하는 불량 수
    5) 하룻동안 발생하는 출생자 수
    6) 어떤 시간 동안 톨게이트를 통과하는 차량의 수
    7) 길바닥에 빗방울이 떨어지는 횟수
    • 각 사각형에 빗방울이 떨어지는 사건은 이항분포이지만, 그 사건은 서로 독립임.
      - 빗방울은 많이 떨어지지만 한 사각형 안에 떨어질 확률은 작기 때문에, 포아송 분포로도 볼 수 있음
  • 위 예시들은 완벽한 포아송 분포가 아니지만 추정하기 유용한 분포임

포아송근사(poisson approximation)

  • poisson paradigm이라고도 부름
  • 어떤 큰 숫자 n에 대하여 A1,...,An의 사건들이 각각 P(Aj)=pj라는 낮은 확률로 발생하고, 각 사건은 독립(이거나 weakly dependent)일 때, 발생하는 사건(Aj)의 수는 Pois(λ)의 분포를 따른다.
    • λ=pj
  • 또한 Bin(n,p) 는 n→∞ , p→0 하고 np=λ 가 상수로 유지될 때 (n과 p가 증가하는 속도가 같음) 이항확률변수 X의 분포는 포아송에 근사하게 된다.
  • 증명)
    P(X=k)=(nk)pk(1p)nk이고 p=λn로 놓았을 때,
    = n(n1)...(nk+1)k!(λn)k(1λn)nk
    = n(n1)...(nk+1)λkk!nk(1λn)n(1λn)kn(n1)...(nk+1)nk1,(1λn)k1,(1λn)neλ 이므로
  • P(X=k)λkk!eλ
    ​​
  • 이고 n→∞ 에 따라P(X=k)λkk!eλ
  • n(n1)...(nk+1)nk1,(1λn)k1,(1λn)neλ 이므로
728x90
반응형