Statistics & Math/기초통계학

[기초통계학] Monty Hall(몬티홀) 문제와 Simpson's Paradox(심슨의 역설)

YSY^ 2023. 12. 3. 21:46

Monty Hall 문제

세 개의 문 중에 하나 뒤에는 자동차가 있고, 나머지 두 개 뒤에는 염소가 있다. Monty가 내가 고르지 않은 문 중 하나를 열어 염소가 있는 것을 보여줬다면, 나는 처음 고른 문에서 바꾸는 것이 유리한가, 그렇지 않은가?

1. 수형도로 확인한다.

CASE 1) 내가 고른문이 1번, 자동차가 있는 문이 1번인 경우

  • Monty는 2번이나 3번문을 열수밖에 없으며 각각의 확률은 1/2씩이다

CASE 2) 내가 고른문이 1번, 자동차가 있는 문이 2번인 경우

  • Monty는 3번문을 열어줄 수 밖에 없으며 확률은 1이다

CASE 3) 내가 고른문이 1번, 자동차가 있는 문이 3번인 경우

  • Monty는 2번문을 열어줄 수 밖에 없으며 확률은 1이다

여기서 내가 1번문을 선택했는데, Monty가 2번문을 열었을 경우

  • Monty가 2번문을 열였을 가능성은 2가지이다.
    • 1번 문뒤에 자동차가 있을 확률 : (1/3) * (1/2) = 1/6
    • 3번 문뒤에 자동차가 있을 확률 : (1/3) * 1 = 1/3

여기서 조건부 확률을 구한다면

  • P(선택을 변경했을 때 성공확률 | Monty가 2번 문을 연 경우)
    • = (1/3) / (1/6+ 1/3) = 2/3

Monty가 2번 문을 열었을 때, 선택을 변경했을 때 성공확률은 2/3이다.

따라서 선택을 변경하는것이 확률적으로 유리하다.

2. 전체 확률의 법칙

  • $S$ : 처음 선택에서 바꿔서 자동차 있는 문을 맞추는 사건
  • $D_j$ : j번 문 뒤에 자동차가 있는 사건 $(j \in {1, 2, 3} )$

$P(S) = P(S|D_1)\times \large{\frac{1}{3}}​ + P(S|D_2) \times \large \frac{1}{3} +P(S|D_3) \times \large \frac{1}{3}$
$= 0 + 1\times \large \frac {1}{3}​​ + 1 \times \large \frac {1}{3} = \frac {2}{3}$

또한 Monty는 내가 고르지 않은 두 개의 문이 둘 다 염소가 있다면 두 문을 열 확률은 같으므로

$ P(S∣ Monty가 2번문을 연다) = \large \frac{2}{3} = P(S)$

으로, 조건부 확률과 조건부가 아닌 확률 값이 일치한다.

Simpson's Paradox(심슨의 역설)

  • 부분에서 성립하는 대소 관계는 전체를 보았을 때 역전될 수도 있다.

예시) 심슨 가족이 사는 스프링필드에 A, B 두 명의 의사가 있고, 그들은 심장 수술과 반창고 제거 두 가지 수술을 한다고 가정하자

의사 A 심장 수술 반창고 제거 > 의사 B 심장 수술 반창고 제거
성공 70 10 성공 2 81  
실패 20 0 실패 8 9  
  77.8% 100%   20% 90%  
전체 수술 성공률 80%   < 전체 수술 성공률 83%  

수술종류별 성공률을 봤을때 의사 A의 성공률이 높다, 하지만 전체수술 성공률을 봤을때 의사 B의 성공률이 더 높다. 이런 현상을 심슨의 역설이라고 부른다.

이론적 접근

  • A: 수술이 성공하는 사건
  • B: 의사B 가 수술을 집도하는 사건
  • C: 심장 수술을 받는 사건

심장) $P(A|B,C) < P(A|B^C,C)$
반창고) $P(A|B,C^C) < P(A|B^C,C^C)$

로 의사 A가 각각의 수술이라는 조건부 확률에서는 더 좋은 성적을 보일 수 있다

하지만 무조건부 확률을 보면 $ P(A|B) > P(A|B^C)$ 와 같이 역전될 수가 있다는 것이다.

⇒ 여기서 C(수술의 종류)는 confounder (교란변수)라고 하며, 이렇게 적절한 confounder에 의한 조건부 확률을 확인하지 않으면 상황에 대한 그릇된 판단을 내릴 위험이 있다.

전체 확률의 정의를 이용해 심슨의 역설이 틀렸음을 증명

$ P(A|B) = P(A|B,C)P(C|B) + P(A|B,C^C)P(C^C|B)$ 에서

문제에서 주어진 조건에서 $P(A|B,C) < P(A|B^C,C), P(A|B,C^C) < P(A|B^C,C^C)$ 는 확인 가능하지만,

$ P(C|B), P(C^C|B)$ 가 좌항, 우항에 서로 다른 가중치로 작용하기 때문에 증명할 수 없다.

728x90
반응형