Statistics & Math/기초통계학

[기초통계학] 확률의 기본 개념(표본공간, 곱의 법칙, 이항정리), 표본추출정리, 확률의 공리

YSY^ 2023. 10. 15. 17:55

확률론의 활용영역

  • 유전학, 물리학, 계랑경제학, 금융, 역사학, 정치
  • 인문학, 사회과학계에서도 중요도와 활용이 늘어나고 있음
  • 도박과 게임 - 통계에서 여러 번 연구된 주제이다(페르마, 파스칼)
  • 인생 전반: (수학이 활실성에 대한 학문이라면,) 확률은 불확실성(uncertainty)을 계량화하는 것을 가능하게 해 준다.

확률의 기본 개념

  • 표본공간(sample space): 시행에서 발생 가능한 모든 경우의 집합
  • 사건(event): 표본공간의 부분집합
  • 확률의 naïve 한 정의
    • $P(A) = \frac{(사건 A가 발생하는 경우의 수)}{(발생 가능한 모든 경우의 수)}$
    • 분모는 표본공간과 같음
    • 두개의 동전을 던졌을 때 둘다 앞면이 나올 확률 : $P(A) = \frac{1}{4}$
    • 가정 : 모든 경우가 같은 확률로 나오며, 가능한 경우가 유한함(유한한 표본공간)
  • 셈 원리(Counting Principle)
    • 곱의 법칙(Multiplication Rule): 발생 가능한 경우의 수가 $n_1, n_2, ... , n_r$ ​​ 가지인 1,2, ...,r 번의 시행에서 발생 가능한 모든 경우의 수는 $\Large n_1 \times n_2 \times ... \times n_r$​​ 이다.
  • 이항계수(Binomial Coefficient): $\Large {n\choose k} = \frac{n!}{(n-k)!k!}​$
    • 크기 n의 집합에서 만들 수 있는 크기 k인 부분집합의 수(순서 관계 없이)
    • k가 n보다 큰 경우는 0으로 정의 (불가능함)
    • k를 뽑는 경우의 수는 다음과 같음 : n * n-1 * n-2 * .... * (n-k+1)
    • 다만 k를 중복해서 뽑았으니 k! 만큼 나눠주어야함
    • EX) 포커에서 풀하우스 (숫자가 같은 카드 3장 + 숫자가 같은 카드 2장)이 나올 확률 (카드는 총 52장이며 13개의 카드가 4장씩 있음)
      • $\Large \frac {13 * {4 \choose 3} * 12 {4 \choose 2}}{52 \choose 5}​$

표본 추출 정리

  • 다른 경우들은 곱의 법칙으로 설명이 되지만, (복원, 순서 상관이 없는) 경우 그렇지 않음.
  • n개에서 k개를 순서 상관 없이, 복원하며 뽑는 경우의 수: $\Large {n+k-1}\choose k$
  • 숫자 대입해서 확인해보기
    • (일반적인 경우) k = 1 대입: $\large n\choose 1$
    • (극단적인 경우) k = 0 대입: $\large {n-1}\choose 0$
    • (간단하지만 당연하지는 않은 값) n = 2 대입: $\large {k+1\choose k} = \large {k+1 \choose 1}=k+1$

  • Ex) n개의 상자에 k개의 구별 불가능한 object들을 넣을 수 있는 경우의 수는 얼마인가?
    • 구슬과 같이 실물이 있는 물체는 labeling이 가능하며 서로 구별이 가능하다. 따라서 확률의 naive한 정의로 접근 가능
    • 하지만 물리학, counting problem에서의 경우에는 object들이 항상 구별 가능한 것이 아니기 때문에 이와 같은 접근이 어려움
    • 위 문제는 n+k-1개의 위치에 원과 구분선을 배열하는 것과 같다. 원의 위치를 먼저 정하면 구분선의 위치도 결정되고, 그 반대도 성립하기 때문에, 다음과 같은 등식이 성립함을 확인할 수 있다.
    • $\Large {n+k-1\choose n-1} = \Large {n+k-1\choose k}$

k개의 원과 n-1개의 구분선을 배열하는 것과 같다.

Story Proof

  • 상황 해석을 통한 증명 (대수적 방법으로 접근하는 것보다 훨씬 쉬울 때가 있음!)
    1) $\large {n\choose k} = \large {n \choose n-k}$
    2) $n * \large {n-1 \choose k-1} = k * \large {n\choose k}$
    • n명 중에서 k명 뽑기, k명 중에서 한 명을 회장으로 뽑는 문제로 해석
    • 회장을 먼저 뽑고 나머지 k명에 들어갈 사람 뽑기 ⇔ k명을 뽑고 그 중에서 회장 뽑기
      3) ${m+n \choose k} = \displaystyle\sum_{j=0}^{k} {m\choose j} {n\choose {k-j}}$
    • 방데르몽드 항등식이라고 불림
    • m+n개에서 k개뽑기

각 사건은 모두 독립이기에 전부 더하면 됨.

Non-naïve definition of probability

  • 모든 경우의 확률이 각각 다른 경우
  • 확률공간(Probability space) : S와 P로 구성
    • S : 표본공간 (어떤 사건 A는 S의 부분집합)
    • P : 함수 (어떤 사건 A를 입력으로 하는 함수)
  • 공리
    • 아래 세 가지 공리로부터 대부분의 식을 유도할 수 있음
    1. 공집합에 대한 확률은 0이다 (불가능하기 때문에)
      • $P(S) = 1P(ϕ)=0$
    2. 전체 표본 공간의 확률(적어도 사건 A가 발생할 확률)은 1이다.
      • P(S)=1
    3. 합사건의 확률은 모든 확률의 합과 같다. (A1, A2.... 가 모두 서로소 일 경우만)
      • $P(\bigcup_{n=1} ^\infty A_n) = \displaystyle\sum_{n=1} ^\infty P(A_n)$
      • $A_i, A_j는 서로소이다$
728x90
반응형