기하확률분포(geometric random variable)
![[기초통계학] 기하분포와 음이항분포 0](http://t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png)
: 여러 번의 독립시행에서 첫 번째 성공까지의 실패 수- 성공전에 얼마나 실패했는지 보여줌
- 이항분포나 초기하분포에서는 시행횟수 n을 정해놓고, 성공한 횟수에 관심을 가졌으나, 기하분포는 시행횟수에 초점을 맞춘것
- 기하분포에서는 X는 성공할때까지 시행했을때 실패한 횟수이며, U는 성공할때까지 시행한 횟수를 의미
- Y = X + 1
- 이런 확률질량함수를 가지는 경우 모수가 p인 기하분포를 따른다고 한다.
라고 할 때, - X의 확률질량함수:
- 조건 확인:
- CF) 등비급수의 극한
- CF) 등비급수의 극한
- 기하분포는 무기억성의 특징이 있음(독립)
- 즉, 4번째까지 실패했을때 5번째 성공확률이나, 5번째까지 실패했을때 6번째의 성공확률이나 모두 p임
기하확률분포의 기댓값
- X는 실패한 횟수, Y는 시행횟수
- E(X) (실패횟수의 기대값)
→ 양쪽에 미분 취하기
→ - E(Y) (시행횟수의 기대값)
기하확률분포의 기댓값(Story proof)
음이항분포(Negative Binomial)
![[기초통계학] 기하분포와 음이항분포 2](http://t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png)
- 음이항분포는 기하분포를 일반화한 분포
- 기하분포는 성공 확률이 p인 베르누이 시행에서 처음으로 성공할 때까지의 시행 횟수
- 반면, 음이항분포는 성공 확률이 p인 베르누이 시행에서 r번째 성공까지의 시행 횟수, 즉, 성공전까지의 실패횟수의 분포
- 음이항확률변수가 크다는 의미는 r번 성공까지 더 많은 시행을 했다는 의미와 같음
- 그렇기에 음이항분포에서는 x번의 시행에서 처음 r-1번의 성공과 마지막 r번째 성공 사이에는 실패가 포함될 수 있음
- 주의 사항 : 음수도 아니고 이항도 아님
- 두개의 변수가 존재 : 모수 r,p
- 여기서는 데구르트 방법을 사용 (기하를 0부터 시작) (1부터 시작하는 거면 성공횟수를 세는것)
1) 의미: 여러 번의 Bern(p) 독립시행 중에서 r번째 성공까지의 실패 횟수
2) PMF:
- r-1 : r번 성공하기 전까지의 성공 횟수 (EX 5번째 성공까지의 실패횟수를 구하려면 이전에 4번성공했어야함)
- n : r번 성공하기 전까지의 실패 횟수
- 즉 r번 성공하기 전까지의 성공한 순서/실패 순서(위치)를 정해주면된다
- n + r-1 번 중, r-1번 성공 위치를 선택하는 횟수 = n + r-1 번 중, n번 실패하는 위치를 선택하는 횟수
3) 기대값 구하기 (지시확률변수 활용)
- X는 실패한 횟수, Y는 시행횟수
- E(X) (실패횟수의 기대값)
→ 가장 간단한 상황: r=1일 때
j-1 ~ j 성공 사이의 실패횟수와, j ~ j+1성공사이의 실패횟수는 독립적이며
- E(Y) (시행횟수의 기대값)
성공분포 (First Success)
- 첫 번째 성공까지 걸린 시도 수 'First Success' 분포:
- Y = X -1라 하였을 때(성공 빼기),
이항분포와 음이항분포의 관계
- n번 시행해서 x번 성공할 확률 분포: 이항분포 (cf.https://ysyblog.tistory.com/392)
- r번 성공까지 x번 시행할 확률 분포 : 음이항분포
- 성공확률이 p인 베르누이 시행에서,
일 때 n번 시행해서 r번 이상 성공할 확률 와 일 때 r번 성공하는데 n번 이하 시행할 확률 는 같음.
- 즉,
예제
- St.Petersburg Paradox
처음으로 동전 앞면이 나올 때까지 동전을 던진 횟수(성공 포함)를 X라 하였을 때, 달러를 받는 게임이 있다고 하자. 이 게임을 하기 위해 얼마를 내야할까 (받는 돈)
Y의 기대값을 찾는 것이 이문제의 목적 (?..)
∞가 아닌, 까지라고 할 때는
728x90
반응형
'Statistics & Math > 기초통계학' 카테고리의 다른 글
[기초통계학] 포아송분포(poisson distribution) (2) | 2023.12.31 |
---|---|
[기초통계학] 가설검정과 P값 (p-value) (2) | 2023.12.31 |
[기초통계학] 기댓값 (Expected Value) (1) | 2023.12.17 |
[기초통계학] 누적분포함수(Cumulative Distribution Function) (1) | 2023.12.17 |
[기초통계학] 확률변수 (Random Variable), 베르누이시행, 이항분포 (0) | 2023.12.16 |