확률론의 활용영역
- 유전학, 물리학, 계랑경제학, 금융, 역사학, 정치
- 인문학, 사회과학계에서도 중요도와 활용이 늘어나고 있음
- 도박과 게임 - 통계에서 여러 번 연구된 주제이다(페르마, 파스칼)
- 인생 전반: (수학이 활실성에 대한 학문이라면,) 확률은 불확실성(uncertainty)을 계량화하는 것을 가능하게 해 준다.
확률의 기본 개념
- 표본공간(sample space): 시행에서 발생 가능한 모든 경우의 집합
- 사건(event): 표본공간의 부분집합
- 확률의 naïve 한 정의
- $P(A) = \frac{(사건 A가 발생하는 경우의 수)}{(발생 가능한 모든 경우의 수)}$
- 분모는 표본공간과 같음
- 두개의 동전을 던졌을 때 둘다 앞면이 나올 확률 : $P(A) = \frac{1}{4}$
- 가정 : 모든 경우가 같은 확률로 나오며, 가능한 경우가 유한함(유한한 표본공간)
- 셈 원리(Counting Principle)
- 곱의 법칙(Multiplication Rule): 발생 가능한 경우의 수가 $n_1, n_2, ... , n_r$ 가지인 1,2, ...,r 번의 시행에서 발생 가능한 모든 경우의 수는 $\Large n_1 \times n_2 \times ... \times n_r$ 이다.
- 이항계수(Binomial Coefficient): $\Large {n\choose k} = \frac{n!}{(n-k)!k!}$
- 크기 n의 집합에서 만들 수 있는 크기 k인 부분집합의 수(순서 관계 없이)
- k가 n보다 큰 경우는 0으로 정의 (불가능함)
- k를 뽑는 경우의 수는 다음과 같음 : n * n-1 * n-2 * .... * (n-k+1)
- 다만 k를 중복해서 뽑았으니 k! 만큼 나눠주어야함
- EX) 포커에서 풀하우스 (숫자가 같은 카드 3장 + 숫자가 같은 카드 2장)이 나올 확률 (카드는 총 52장이며 13개의 카드가 4장씩 있음)
- $\Large \frac {13 * {4 \choose 3} * 12 {4 \choose 2}}{52 \choose 5}$
표본 추출 정리
- 다른 경우들은 곱의 법칙으로 설명이 되지만, (복원, 순서 상관이 없는) 경우 그렇지 않음.
- n개에서 k개를 순서 상관 없이, 복원하며 뽑는 경우의 수: $\Large {n+k-1}\choose k$
- 숫자 대입해서 확인해보기
- (일반적인 경우) k = 1 대입: $\large n\choose 1$
- (극단적인 경우) k = 0 대입: $\large {n-1}\choose 0$
- (간단하지만 당연하지는 않은 값) n = 2 대입: $\large {k+1\choose k} = \large {k+1 \choose 1}=k+1$
- Ex) n개의 상자에 k개의 구별 불가능한 object들을 넣을 수 있는 경우의 수는 얼마인가?
- 구슬과 같이 실물이 있는 물체는 labeling이 가능하며 서로 구별이 가능하다. 따라서 확률의 naive한 정의로 접근 가능
- 하지만 물리학, counting problem에서의 경우에는 object들이 항상 구별 가능한 것이 아니기 때문에 이와 같은 접근이 어려움
- 위 문제는 n+k-1개의 위치에 원과 구분선을 배열하는 것과 같다. 원의 위치를 먼저 정하면 구분선의 위치도 결정되고, 그 반대도 성립하기 때문에, 다음과 같은 등식이 성립함을 확인할 수 있다.
- $\Large {n+k-1\choose n-1} = \Large {n+k-1\choose k}$
Story Proof
- 상황 해석을 통한 증명 (대수적 방법으로 접근하는 것보다 훨씬 쉬울 때가 있음!)
1) $\large {n\choose k} = \large {n \choose n-k}$
2) $n * \large {n-1 \choose k-1} = k * \large {n\choose k}$- n명 중에서 k명 뽑기, k명 중에서 한 명을 회장으로 뽑는 문제로 해석
- 회장을 먼저 뽑고 나머지 k명에 들어갈 사람 뽑기 ⇔ k명을 뽑고 그 중에서 회장 뽑기
3) ${m+n \choose k} = \displaystyle\sum_{j=0}^{k} {m\choose j} {n\choose {k-j}}$ - 방데르몽드 항등식이라고 불림
- m+n개에서 k개뽑기
Non-naïve definition of probability
- 모든 경우의 확률이 각각 다른 경우
- 확률공간(Probability space) : S와 P로 구성
- S : 표본공간 (어떤 사건 A는 S의 부분집합)
- P : 함수 (어떤 사건 A를 입력으로 하는 함수)
- 공리
- 아래 세 가지 공리로부터 대부분의 식을 유도할 수 있음
- 공집합에 대한 확률은 0이다 (불가능하기 때문에)
- $P(S) = 1P(ϕ)=0$
- 전체 표본 공간의 확률(적어도 사건 A가 발생할 확률)은 1이다.
- P(S)=1
- 합사건의 확률은 모든 확률의 합과 같다. (A1, A2.... 가 모두 서로소 일 경우만)
- $P(\bigcup_{n=1} ^\infty A_n) = \displaystyle\sum_{n=1} ^\infty P(A_n)$
- $A_i, A_j는 서로소이다$
728x90
반응형
'Statistics & Math > 기초통계학' 카테고리의 다른 글
[기초통계학] 독립(Independence)과 조건부확률(Conditional Probability) (1) (1) | 2023.10.22 |
---|---|
[기초통계학] 확률의 non-naïve한 정의의 공리, 확률의 특성, 포함배제의 원리 (0) | 2023.10.15 |
[기초통계학] Two-way ANOVA(이원배치 분산분석)(2) - F-value(F값) 계산 (0) | 2021.02.15 |
[기초통계학] Two-way ANOVA(이원배치 분산분석)(1) - Interaction(상호작용) (0) | 2021.02.14 |
[기초통계학] One-way ANOVA(일원배치 분산분석) (F-Value) (2) | 2021.02.14 |