Monty Hall 문제
세 개의 문 중에 하나 뒤에는 자동차가 있고, 나머지 두 개 뒤에는 염소가 있다. Monty가 내가 고르지 않은 문 중 하나를 열어 염소가 있는 것을 보여줬다면, 나는 처음 고른 문에서 바꾸는 것이 유리한가, 그렇지 않은가?
1. 수형도로 확인한다.
CASE 1) 내가 고른문이 1번, 자동차가 있는 문이 1번인 경우
- Monty는 2번이나 3번문을 열수밖에 없으며 각각의 확률은 1/2씩이다
CASE 2) 내가 고른문이 1번, 자동차가 있는 문이 2번인 경우
- Monty는 3번문을 열어줄 수 밖에 없으며 확률은 1이다
CASE 3) 내가 고른문이 1번, 자동차가 있는 문이 3번인 경우
- Monty는 2번문을 열어줄 수 밖에 없으며 확률은 1이다
여기서 내가 1번문을 선택했는데, Monty가 2번문을 열었을 경우
- Monty가 2번문을 열였을 가능성은 2가지이다.
- 1번 문뒤에 자동차가 있을 확률 : (1/3) * (1/2) = 1/6
- 3번 문뒤에 자동차가 있을 확률 : (1/3) * 1 = 1/3
여기서 조건부 확률을 구한다면
- P(선택을 변경했을 때 성공확률 | Monty가 2번 문을 연 경우)
- = (1/3) / (1/6+ 1/3) = 2/3
Monty가 2번 문을 열었을 때, 선택을 변경했을 때 성공확률은 2/3이다.
따라서 선택을 변경하는것이 확률적으로 유리하다.
2. 전체 확률의 법칙
- $S$ : 처음 선택에서 바꿔서 자동차 있는 문을 맞추는 사건
- $D_j$ : j번 문 뒤에 자동차가 있는 사건 $(j \in {1, 2, 3} )$
$P(S) = P(S|D_1)\times \large{\frac{1}{3}} + P(S|D_2) \times \large \frac{1}{3} +P(S|D_3) \times \large \frac{1}{3}$
$= 0 + 1\times \large \frac {1}{3} + 1 \times \large \frac {1}{3} = \frac {2}{3}$
또한 Monty는 내가 고르지 않은 두 개의 문이 둘 다 염소가 있다면 두 문을 열 확률은 같으므로
$ P(S∣ Monty가 2번문을 연다) = \large \frac{2}{3} = P(S)$
으로, 조건부 확률과 조건부가 아닌 확률 값이 일치한다.
Simpson's Paradox(심슨의 역설)
- 부분에서 성립하는 대소 관계는 전체를 보았을 때 역전될 수도 있다.
예시) 심슨 가족이 사는 스프링필드에 A, B 두 명의 의사가 있고, 그들은 심장 수술과 반창고 제거 두 가지 수술을 한다고 가정하자
의사 A | 심장 수술 | 반창고 제거 | > | 의사 B | 심장 수술 | 반창고 제거 |
---|---|---|---|---|---|---|
성공 | 70 | 10 | 성공 | 2 | 81 | |
실패 | 20 | 0 | 실패 | 8 | 9 | |
77.8% | 100% | 20% | 90% | |||
전체 수술 성공률 | 80% | < | 전체 수술 성공률 | 83% |
수술종류별 성공률을 봤을때 의사 A의 성공률이 높다, 하지만 전체수술 성공률을 봤을때 의사 B의 성공률이 더 높다. 이런 현상을 심슨의 역설이라고 부른다.
이론적 접근
- A: 수술이 성공하는 사건
- B: 의사B 가 수술을 집도하는 사건
- C: 심장 수술을 받는 사건
심장) $P(A|B,C) < P(A|B^C,C)$
반창고) $P(A|B,C^C) < P(A|B^C,C^C)$
로 의사 A가 각각의 수술이라는 조건부 확률에서는 더 좋은 성적을 보일 수 있다
하지만 무조건부 확률을 보면 $ P(A|B) > P(A|B^C)$ 와 같이 역전될 수가 있다는 것이다.
⇒ 여기서 C(수술의 종류)는 confounder (교란변수)라고 하며, 이렇게 적절한 confounder에 의한 조건부 확률을 확인하지 않으면 상황에 대한 그릇된 판단을 내릴 위험이 있다.
전체 확률의 정의를 이용해 심슨의 역설이 틀렸음을 증명
$ P(A|B) = P(A|B,C)P(C|B) + P(A|B,C^C)P(C^C|B)$ 에서
문제에서 주어진 조건에서 $P(A|B,C) < P(A|B^C,C), P(A|B,C^C) < P(A|B^C,C^C)$ 는 확인 가능하지만,
$ P(C|B), P(C^C|B)$ 가 좌항, 우항에 서로 다른 가중치로 작용하기 때문에 증명할 수 없다.
'Statistics & Math > 기초통계학' 카테고리의 다른 글
[기초통계학] 확률변수 (Random Variable), 베르누이시행, 이항분포 (0) | 2023.12.16 |
---|---|
[기초통계학] Gambler's Ruin(도박꾼의 파산) (1) | 2023.12.16 |
[기초통계학] 독립(Independence)과 조건부확률(Conditional Probability)(2) (전체 확률의 법칙, 수형도를 통한 조건부확률의 이해) (0) | 2023.11.05 |
[기초통계학] 독립(Independence)과 조건부확률(Conditional Probability) (1) (1) | 2023.10.22 |
[기초통계학] 확률의 non-naïve한 정의의 공리, 확률의 특성, 포함배제의 원리 (0) | 2023.10.15 |