Statistics & Math/기초통계학

[기초통계학] 기하분포와 음이항분포

YSY^ 2023. 12. 25. 18:55

기하확률분포(geometric random variable)

[기초통계학] 기하분포와 음이항분포 0
p값에 따른 기하분포. 출처 : https://en.wikipedia.org/wiki/Geometric_distribution

  • Geom(p): 여러 번의 Bern(p) 독립시행에서 첫 번째 성공까지의 실패 수
  • 성공전에 얼마나 실패했는지 보여줌
  • 이항분포나 초기하분포에서는 시행횟수 n을 정해놓고, 성공한 횟수에 관심을 가졌으나, 기하분포는 시행횟수에 초점을 맞춘것
  • 기하분포에서는 X는 성공할때까지 시행했을때 실패한 횟수이며, U는 성공할때까지 시행한 횟수를 의미
    • Y = X + 1
  • 이런 확률질량함수를 가지는 경우 모수가 p인 기하분포를 따른다고 한다.
    XGeom(p),(q=1p)라고 할 때,
  • X의 확률질량함수: P(X=k)=pqk(k0,1,...)
  • 조건 확인: k=0pqk=p1q=1
    • CF) 등비급수의 극한
      • qk11q
        [기초통계학] 기하분포와 음이항분포 1
  • 기하분포는 무기억성의 특징이 있음(독립)
    • 즉, 4번째까지 실패했을때 5번째 성공확률이나, 5번째까지 실패했을때 6번째의 성공확률이나 모두 p임

기하확률분포의 기댓값

  • X는 실패한 횟수, Y는 시행횟수
  • E(X) (실패횟수의 기대값)
    E(X)=k=0kpqk=pk=0kqk
    k=0qk=11q → 양쪽에 미분 취하기
    k=1kqk1=1(1q)2
    k=1kqk=qp2
    E(X)=pk=0kqk=pqp2=qp
  • E(Y) (시행횟수의 기대값)
    E(Y)=E(X+1)=1p
기하확률분포의 기댓값(Story proof)

c=E(X)
c=0p()+(1+c)q()=q+cq
c=q1q=qp

음이항분포(Negative Binomial) NegBin(r,p)

[기초통계학] 기하분포와 음이항분포 2
출처 : https://en.wikipedia.org/wiki/Negative_binomial_distribution

  • 음이항분포는 기하분포를 일반화한 분포
  • 기하분포는 성공 확률이 p인 베르누이 시행에서 처음으로 성공할 때까지의 시행 횟수
  • 반면, 음이항분포는 성공 확률이 p인 베르누이 시행에서 r번째 성공까지의 시행 횟수, 즉, 성공전까지의 실패횟수의 분포
    • 음이항확률변수가 크다는 의미는 r번 성공까지 더 많은 시행을 했다는 의미와 같음
  • 그렇기에 음이항분포에서는 x번의 시행에서 처음 r-1번의 성공과 마지막 r번째 성공 사이에는 실패가 포함될 수 있음
  • 주의 사항 : 음수도 아니고 이항도 아님
  • 두개의 변수가 존재 : 모수 r,p
  • 여기서는 데구르트 방법을 사용 (기하를 0부터 시작) (1부터 시작하는 거면 성공횟수를 세는것)

1) 의미: 여러 번의 Bern(p) 독립시행 중에서 r번째 성공까지의 실패 횟수

2) PMF: P(X=n)=(n+r1r1)prqn=(n+r1n)prqn(n=0,1,2,...)

  • r-1 : r번 성공하기 전까지의 성공 횟수 (EX 5번째 성공까지의 실패횟수를 구하려면 이전에 4번성공했어야함)
  • n : r번 성공하기 전까지의 실패 횟수
  • 즉 r번 성공하기 전까지의 성공한 순서/실패 순서(위치)를 정해주면된다
  • n + r-1 번 중, r-1번 성공 위치를 선택하는 횟수 = n + r-1 번 중, n번 실패하는 위치를 선택하는 횟수

3) 기대값 구하기 (지시확률변수 활용)

  • X는 실패한 횟수, Y는 시행횟수
  • E(X) (실패횟수의 기대값)

→ 가장 간단한 상황: r=1일 때 XGeom(p)
E(X)=qp
E(X)=E(X1+X2+...+Xr)=E(X1)+...+E(Xr)
Xj는 j-1번째와 j번째 성공 사이의 실패 횟수라 할 때,
j-1 ~ j 성공 사이의 실패횟수와, j ~ j+1성공사이의 실패횟수는 독립적이며
XjGeom(p) 이므로

E(X)=r×qp

  • E(Y) (시행횟수의 기대값)
    E(Y)=rp

성공분포 (First Success)

  • 첫 번째 성공까지 걸린 시도 수 'First Success' 분포: XFS(p)
  • Y = X -1라 하였을 때(성공 빼기), YGeom(p)

E(X)=E(Y)+1=qp+1=1p

이항분포와 음이항분포의 관계

  • n번 시행해서 x번 성공할 확률 분포: 이항분포 (cf.https://ysyblog.tistory.com/392)
  • r번 성공까지 x번 시행할 확률 분포 : 음이항분포
  • 성공확률이 p인 베르누이 시행에서,
    • XBin(n,p) 일 때 n번 시행해서 r번 이상 성공할 확률 P(Xr)
    • YNegBin(r,p) 일 때 r번 성공하는데 n번 이하 시행할 확률 P(Yn)는 같음.
  • 즉, P(Xr)=P(Yn)

예제

  1. St.Petersburg Paradox
    처음으로 동전 앞면이 나올 때까지 동전을 던진 횟수(성공 포함)를 X라 하였을 때, 2X달러를 받는 게임이 있다고 하자. 이 게임을 하기 위해 얼마를 내야할까
    Y=2X(받는 돈)
    Y의 기대값을 찾는 것이 이문제의 목적
    E(Y)=k=12k12k=k=11= (?..)
    ∞가 아닌, 240 까지라고 할 때는 E(Y)=k=1402k12k=40
    E(Y)=E(2X)=
728x90
반응형