Statistics & Math/기초통계학

[기초통계학] 독립(Independence)과 조건부확률(Conditional Probability)(2) (전체 확률의 법칙, 수형도를 통한 조건부확률의 이해)

YSY^ 2023. 11. 5. 21:42

전체 확률의 법칙

A1, A2, A3, A4: 전체인 S를 분할한 것 (공간을 서로소 집합으로 분할)
주어진 자료로 문제를 잘 '분할'하여 접근하기

S를 $A_1, A_2, ... A_n$ 의 서로소인 분할들로 나누어 놓았다고 했을 때,

$P(B) = P(B \cap A_1) + P(B \cap A_2) + ... + P(B \cap A_n)$
가 성립하며, 이는 곧

$ = P(B|A_1)P(A_1) + P(B|A_2)P(A_2) +... + P(B|A_n)P(A_n)$ 로도 다시 쓰일 수 있다.

이를 전체 확률의 법칙(Law of Total Probability)라고 한다.

조건부 확률과 예시

조건부 독립: 'A와 B는 조건 C 하에서 독립이다'

정의) $P(A \cap B|C) = P(A|C)P(B|C)$

조건부 확률이 중요한 이유

  1. 그자체로 중요함
  2. 비조건부 확률(P(B))이 있더라도, 여전히 작은 조각으로 쪼개기 위해서는 조건부 확률이 있어야함

조건부 확률 예제 1)

  • 카드 한 벌에서 무작위로 두 장을 뽑았을 때, 한장이 에이스일때 두장모두 에이스일 확률

i) P(두 장 다 에이스| 에이스를 뽑음) = P(두 장 다 에이스) / P(에이스를 뽑음)
= P(두 장 다 에이스) / (1- P(2장 카드 모두 A가 아닐 확률))

= $\huge{\frac{{4\choose 2}/{52 \choose 2}}{1-{48 \choose 2}/{52 \choose 2}}}$
$ = \Large \frac{1}{33}$

ii) P(두 장 다 에이스| 스페이드 에이스를 뽑음)

[♠] [?]

한 장의 카드는 스페이드 에이스로 정해져 있기 때문에, 두 장의 카드 중에서 [?]에 해당하는 한 장의 카드를 나머지 3개의 에이스 중에서 뽑으면 된다.

따라서 구하는 확률 $\Large = \frac {3}{51} = \frac{1}{17}$

조건부 확률 예제 2)

  • 인구의 1%가 걸리는 병이 있고, 이 병의 검사 결과가 ‘95%의 정확도를 갖고 있다’고 하자. 검사가 양성으로 나왔을 때, 실제로 이 병에 걸렸을 경우는?

병에 걸리는 사건을 D, 검사 결과 양성으로 나오는 사건을 T라고 하자.

문제에서 P(D) = 0.01 로 주어졌고, ‘95%의 정확도를 갖고 있다’를 $P(T|D) = P(T^C|D^C) = 0.95$라고 해석할 수 있다고 가정하면,

  • 구하고자 하는 확률 $P(D|T)$ 는
    $ \Large = \frac{P(T|D)P(D)}{P(T)} = \frac{P(T|D)P(D)}{P(T|D)P(D)+ P(T|D^C)P(D^C)}$
    ​​ 과 같이 구할 수 있다.
  • 또한 $P(T|D) = P(T^C|D^C) = 0.95$이기에 $P(T|D^C) = 0.05$이다 (여사건)

따라서 $\frac{(0.95)(0.01)}{(0.95)(0.01)+ (0.05)(0.99)} = 16.1%$

이는 수형도로도 풀어볼 수 있다. (수형도로 보는 것이 더 이해가 잘 될 것이다.)

위 예시를 수형도로 나타내면 아래와 같다.

여기서 검사가 양성으로 나왔을 때 병에 걸린 확률은

= 95 / (95 + 495)

= 16.1% 이다

조건부 확률 문제를 풀며 자주 하는 실수

  1. $P(A|B)와 P(B|A)$를 헷갈리는 것: ‘조건’과 ‘구하고자 하는 것’을 확실히 알기! (prosecutor's fallacy)
    • EX) 예제 2에서 검사가 양성으로 나왔을 때 병에 걸린 확률(P(A|B))는 16.1%인 반면, 병에 결렸을때 검사가 양성으로 나왔을 확률(P(B|A))는 95/100 = 95%이다.
    • EX) O. J. 심슨 사건
      • 당시 검사는 "가정폭력을 당한 전체 여성 중 1/2500만이 남편에 의해 죽었다"고 주장했으나, 실제로는 "살해당한 여성 중 가정폭력의 전력이 있는 남편에 의해 살해되었을 확률은 약 90%이다"였다.
      • 여기서 검사의 오류가 드러나는데, 피해자인 심슨의 아내는 가정폭력 뿐만 아니라 심슨에 의해 가정폭력을 당한 상황에서 다른 누군가에 의해 살해되었을 확률을 고려해야한다.
      • 즉 절대다수의 가정폭력 사례는 살인까지 발생하지 않지만, 그 살인사건이 가정폭력의 전력이 있다는 전제 하에 그 범인은 그의 배우자이
      • 즉, 주객전도가 된 것.
  2. $P(A) '사전확률‘(prior)과 P(A|B) ‘사후확률'(posterior)$를 헷갈리는 것
  3. 독립과 조건부 독립을 헷갈리는 것

조건부 독립과 독립의 관계

  1. 조건부 독립 ⇒ 독립이 성립하는가? (조건부 독립이 P(C)조건 하에서 A와 B가 독립함을 의미하는가) FALSE
    • 예를들어 만난적 없는 상대와 체스를 여러판을 두는 경우(P(C)) 내가 이길 확률이 P(A), 상대방이 이길확률이 P(B)라고 한다면
    • 내가 다섯판을 이긴 경우 상대편의 실력이 가늠이 되기에, 전체적으로는 독립이 성립하지 않음
    • 독립은 예전 경기가 나중에 치러질 경기의 결과를 예측하는데 아무런 정보를 줄 수 없을때의 이야기이기 때문
  2. 독립 ⇒ 조건부 독립이 성립하는가? FALSE
    • 예를 들어 화재 경보가 울리는 사건(F)가 있을 경우 화재경보가 울리게 하는 방법이 2가지 밖에 없다면 (P(A) : 불이 실제로 난 경우, P(C) : 팝콘을 튀길때)
    • 사건 (F)와 사건 P(C)가 독립일 경우 $P(F|A,C^C) = 1$
    • 화재경보가 울렸다면, 팝콘을 튀겼을 경우를 제외하면 무조건 불이 난것이기 때문
    • 따라서 사건 (F)와 사건 P(C)는 독립이지만, 화재경보가 우렸다는 조건하에서는 조건부 독립이 아님 (종속)
728x90
반응형