Statistics & Math/기초통계학

[기초통계학] Monty Hall(몬티홀) 문제와 Simpson's Paradox(심슨의 역설)

YSY^ 2023. 12. 3. 21:46

Monty Hall 문제

세 개의 문 중에 하나 뒤에는 자동차가 있고, 나머지 두 개 뒤에는 염소가 있다. Monty가 내가 고르지 않은 문 중 하나를 열어 염소가 있는 것을 보여줬다면, 나는 처음 고른 문에서 바꾸는 것이 유리한가, 그렇지 않은가?

[기초통계학] Monty Hall(몬티홀) 문제와 Simpson's Paradox(심슨의 역설) 0

1. 수형도로 확인한다.

[기초통계학] Monty Hall(몬티홀) 문제와 Simpson's Paradox(심슨의 역설) 1

CASE 1) 내가 고른문이 1번, 자동차가 있는 문이 1번인 경우

  • Monty는 2번이나 3번문을 열수밖에 없으며 각각의 확률은 1/2씩이다

CASE 2) 내가 고른문이 1번, 자동차가 있는 문이 2번인 경우

  • Monty는 3번문을 열어줄 수 밖에 없으며 확률은 1이다

CASE 3) 내가 고른문이 1번, 자동차가 있는 문이 3번인 경우

  • Monty는 2번문을 열어줄 수 밖에 없으며 확률은 1이다

여기서 내가 1번문을 선택했는데, Monty가 2번문을 열었을 경우

  • Monty가 2번문을 열였을 가능성은 2가지이다.
    • 1번 문뒤에 자동차가 있을 확률 : (1/3) * (1/2) = 1/6
    • 3번 문뒤에 자동차가 있을 확률 : (1/3) * 1 = 1/3

여기서 조건부 확률을 구한다면

  • P(선택을 변경했을 때 성공확률 | Monty가 2번 문을 연 경우)
    • = (1/3) / (1/6+ 1/3) = 2/3

Monty가 2번 문을 열었을 때, 선택을 변경했을 때 성공확률은 2/3이다.

따라서 선택을 변경하는것이 확률적으로 유리하다.

2. 전체 확률의 법칙

  • S : 처음 선택에서 바꿔서 자동차 있는 문을 맞추는 사건
  • Dj : j번 문 뒤에 자동차가 있는 사건 (j1,2,3)

P(S)=P(S|D1)×13+P(S|D2)×13+P(S|D3)×13
=0+1×13+1×13=23

또한 Monty는 내가 고르지 않은 두 개의 문이 둘 다 염소가 있다면 두 문을 열 확률은 같으므로

P(SMonty2)=23=P(S)

으로, 조건부 확률과 조건부가 아닌 확률 값이 일치한다.

Simpson's Paradox(심슨의 역설)

  • 부분에서 성립하는 대소 관계는 전체를 보았을 때 역전될 수도 있다.

예시) 심슨 가족이 사는 스프링필드에 A, B 두 명의 의사가 있고, 그들은 심장 수술과 반창고 제거 두 가지 수술을 한다고 가정하자

의사 A 심장 수술 반창고 제거 > 의사 B 심장 수술 반창고 제거
성공 70 10 성공 2 81  
실패 20 0 실패 8 9  
  77.8% 100%   20% 90%  
전체 수술 성공률 80%   < 전체 수술 성공률 83%  

수술종류별 성공률을 봤을때 의사 A의 성공률이 높다, 하지만 전체수술 성공률을 봤을때 의사 B의 성공률이 더 높다. 이런 현상을 심슨의 역설이라고 부른다.

이론적 접근

  • A: 수술이 성공하는 사건
  • B: 의사B 가 수술을 집도하는 사건
  • C: 심장 수술을 받는 사건

심장) P(A|B,C)<P(A|BC,C)
반창고) P(A|B,CC)<P(A|BC,CC)

로 의사 A가 각각의 수술이라는 조건부 확률에서는 더 좋은 성적을 보일 수 있다

하지만 무조건부 확률을 보면 P(A|B)>P(A|BC) 와 같이 역전될 수가 있다는 것이다.

⇒ 여기서 C(수술의 종류)는 confounder (교란변수)라고 하며, 이렇게 적절한 confounder에 의한 조건부 확률을 확인하지 않으면 상황에 대한 그릇된 판단을 내릴 위험이 있다.

전체 확률의 정의를 이용해 심슨의 역설이 틀렸음을 증명

P(A|B)=P(A|B,C)P(C|B)+P(A|B,CC)P(CC|B) 에서

문제에서 주어진 조건에서 P(A|B,C)<P(A|BC,C),P(A|B,CC)<P(A|BC,CC) 는 확인 가능하지만,

P(C|B),P(CC|B) 가 좌항, 우항에 서로 다른 가중치로 작용하기 때문에 증명할 수 없다.

728x90
반응형