전체 확률의 법칙
A1, A2, A3, A4: 전체인 S를 분할한 것 (공간을 서로소 집합으로 분할)
주어진 자료로 문제를 잘 '분할'하여 접근하기
S를 $A_1, A_2, ... A_n$ 의 서로소인 분할들로 나누어 놓았다고 했을 때,
$P(B) = P(B \cap A_1) + P(B \cap A_2) + ... + P(B \cap A_n)$
가 성립하며, 이는 곧
$ = P(B|A_1)P(A_1) + P(B|A_2)P(A_2) +... + P(B|A_n)P(A_n)$ 로도 다시 쓰일 수 있다.
이를 전체 확률의 법칙(Law of Total Probability)라고 한다.
조건부 확률과 예시
조건부 독립: 'A와 B는 조건 C 하에서 독립이다'
정의) $P(A \cap B|C) = P(A|C)P(B|C)$
조건부 확률이 중요한 이유
- 그자체로 중요함
- 비조건부 확률(P(B))이 있더라도, 여전히 작은 조각으로 쪼개기 위해서는 조건부 확률이 있어야함
조건부 확률 예제 1)
- 카드 한 벌에서 무작위로 두 장을 뽑았을 때, 한장이 에이스일때 두장모두 에이스일 확률
i) P(두 장 다 에이스| 에이스를 뽑음) = P(두 장 다 에이스) / P(에이스를 뽑음)
= P(두 장 다 에이스) / (1- P(2장 카드 모두 A가 아닐 확률))
= $\huge{\frac{{4\choose 2}/{52 \choose 2}}{1-{48 \choose 2}/{52 \choose 2}}}$
$ = \Large \frac{1}{33}$
ii) P(두 장 다 에이스| 스페이드 에이스를 뽑음)
[♠] [?]
한 장의 카드는 스페이드 에이스로 정해져 있기 때문에, 두 장의 카드 중에서 [?]에 해당하는 한 장의 카드를 나머지 3개의 에이스 중에서 뽑으면 된다.
따라서 구하는 확률 $\Large = \frac {3}{51} = \frac{1}{17}$
조건부 확률 예제 2)
- 인구의 1%가 걸리는 병이 있고, 이 병의 검사 결과가 ‘95%의 정확도를 갖고 있다’고 하자. 검사가 양성으로 나왔을 때, 실제로 이 병에 걸렸을 경우는?
병에 걸리는 사건을 D, 검사 결과 양성으로 나오는 사건을 T라고 하자.
문제에서 P(D) = 0.01 로 주어졌고, ‘95%의 정확도를 갖고 있다’를 $P(T|D) = P(T^C|D^C) = 0.95$라고 해석할 수 있다고 가정하면,
- 구하고자 하는 확률 $P(D|T)$ 는
$ \Large = \frac{P(T|D)P(D)}{P(T)} = \frac{P(T|D)P(D)}{P(T|D)P(D)+ P(T|D^C)P(D^C)}$
과 같이 구할 수 있다. - 또한 $P(T|D) = P(T^C|D^C) = 0.95$이기에 $P(T|D^C) = 0.05$이다 (여사건)
따라서 $\frac{(0.95)(0.01)}{(0.95)(0.01)+ (0.05)(0.99)} = 16.1%$
이는 수형도로도 풀어볼 수 있다. (수형도로 보는 것이 더 이해가 잘 될 것이다.)
위 예시를 수형도로 나타내면 아래와 같다.
여기서 검사가 양성으로 나왔을 때 병에 걸린 확률은
= 95 / (95 + 495)
= 16.1% 이다
조건부 확률 문제를 풀며 자주 하는 실수
- $P(A|B)와 P(B|A)$를 헷갈리는 것: ‘조건’과 ‘구하고자 하는 것’을 확실히 알기! (prosecutor's fallacy)
- EX) 예제 2에서 검사가 양성으로 나왔을 때 병에 걸린 확률(P(A|B))는 16.1%인 반면, 병에 결렸을때 검사가 양성으로 나왔을 확률(P(B|A))는 95/100 = 95%이다.
- EX) O. J. 심슨 사건
- 당시 검사는 "가정폭력을 당한 전체 여성 중 1/2500만이 남편에 의해 죽었다"고 주장했으나, 실제로는 "살해당한 여성 중 가정폭력의 전력이 있는 남편에 의해 살해되었을 확률은 약 90%이다"였다.
- 여기서 검사의 오류가 드러나는데, 피해자인 심슨의 아내는 가정폭력 뿐만 아니라 심슨에 의해 가정폭력을 당한 상황에서 다른 누군가에 의해 살해되었을 확률을 고려해야한다.
- 즉 절대다수의 가정폭력 사례는 살인까지 발생하지 않지만, 그 살인사건이 가정폭력의 전력이 있다는 전제 하에 그 범인은 그의 배우자이
- 즉, 주객전도가 된 것.
- $P(A) '사전확률‘(prior)과 P(A|B) ‘사후확률'(posterior)$를 헷갈리는 것
- 독립과 조건부 독립을 헷갈리는 것
조건부 독립과 독립의 관계
- 조건부 독립 ⇒ 독립이 성립하는가? (조건부 독립이 P(C)조건 하에서 A와 B가 독립함을 의미하는가) FALSE
- 예를들어 만난적 없는 상대와 체스를 여러판을 두는 경우(P(C)) 내가 이길 확률이 P(A), 상대방이 이길확률이 P(B)라고 한다면
- 내가 다섯판을 이긴 경우 상대편의 실력이 가늠이 되기에, 전체적으로는 독립이 성립하지 않음
- 독립은 예전 경기가 나중에 치러질 경기의 결과를 예측하는데 아무런 정보를 줄 수 없을때의 이야기이기 때문
- 독립 ⇒ 조건부 독립이 성립하는가? FALSE
- 예를 들어 화재 경보가 울리는 사건(F)가 있을 경우 화재경보가 울리게 하는 방법이 2가지 밖에 없다면 (P(A) : 불이 실제로 난 경우, P(C) : 팝콘을 튀길때)
- 사건 (F)와 사건 P(C)가 독립일 경우 $P(F|A,C^C) = 1$
- 화재경보가 울렸다면, 팝콘을 튀겼을 경우를 제외하면 무조건 불이 난것이기 때문
- 따라서 사건 (F)와 사건 P(C)는 독립이지만, 화재경보가 우렸다는 조건하에서는 조건부 독립이 아님 (종속)
'Statistics & Math > 기초통계학' 카테고리의 다른 글
[기초통계학] Gambler's Ruin(도박꾼의 파산) (1) | 2023.12.16 |
---|---|
[기초통계학] Monty Hall(몬티홀) 문제와 Simpson's Paradox(심슨의 역설) (4) | 2023.12.03 |
[기초통계학] 독립(Independence)과 조건부확률(Conditional Probability) (1) (1) | 2023.10.22 |
[기초통계학] 확률의 non-naïve한 정의의 공리, 확률의 특성, 포함배제의 원리 (0) | 2023.10.15 |
[기초통계학] 확률의 기본 개념(표본공간, 곱의 법칙, 이항정리), 표본추출정리, 확률의 공리 (1) | 2023.10.15 |