반응형

Statistics & Math/기초통계학 32

[기초통계학] 확률의 non-naïve한 정의의 공리, 확률의 특성, 포함배제의 원리

Non-naïve definition of probability 모든 경우의 확률이 각각 다른 경우 확률공간(Probability space) : S와 P로 구성 S : 표본공간 (어떤 사건 A는 S의 부분집합) P : 함수 (어떤 사건 A를 입력으로 하는 함수) 공리 아래 세 가지 공리로부터 대부분의 식을 유도할 수 있음 공집합에 대한 확률은 0이다 (불가능하기 때문에) $P(S) = 1P(ϕ)=0$ 전체 표본 공간의 확률(적어도 사건 A가 발생할 확률)은 1이다. P(S)=1 합사건의 확률은 모든 확률의 합과 같다. (A1, A2.... 가 모두 서로소 일 경우만) $P(\bigcup_{n=1} ^\infty A_n) = \displaystyle\sum_{n=1} ^\infty P(A_n)$ $A_i..

[기초통계학] 확률의 기본 개념(표본공간, 곱의 법칙, 이항정리), 표본추출정리, 확률의 공리

확률론의 활용영역 유전학, 물리학, 계랑경제학, 금융, 역사학, 정치 인문학, 사회과학계에서도 중요도와 활용이 늘어나고 있음 도박과 게임 - 통계에서 여러 번 연구된 주제이다(페르마, 파스칼) 인생 전반: (수학이 활실성에 대한 학문이라면,) 확률은 불확실성(uncertainty)을 계량화하는 것을 가능하게 해 준다. 확률의 기본 개념 표본공간(sample space): 시행에서 발생 가능한 모든 경우의 집합 사건(event): 표본공간의 부분집합 확률의 naïve 한 정의 $P(A) = \frac{(사건 A가 발생하는 경우의 수)}{(발생 가능한 모든 경우의 수)}$ 분모는 표본공간과 같음 두개의 동전을 던졌을 때 둘다 앞면이 나올 확률 : $P(A) = \frac{1}{4}$ 가정 : 모든 경우가 같..

[기초통계학] Two-way ANOVA(이원배치 분산분석)(2) - F-value(F값) 계산

[기초통계학] One-wayANOVA(일원배치 분산분석) :ysyblog.tistory.com/174 [기초통계학] Two-way ANOVA(이원배치 분산분석)(1) - Interaction(상호작용) : ysyblog.tistory.com/175 해당 포스팅은 위 포스팅에 이어진행됩니다. Two-way ANOVA의 F값 - 독립변수가 2개이기 때문에 F값 역시 2개가 되어야 한다. - 추가적으로 Interaction도 유의한지 아닌지 알아야 한다. - 따라서 interaction에 대한 F값도 하나 더 필요하다. 즉, 총 3개의 F값이 필요하다.(첫번째 독립변수의 Main effect를 측정하기 위한 F값, 두번째 독립변수의 Main effect를 측정하기 위한 F값, Interaction effect..

[기초통계학] Two-way ANOVA(이원배치 분산분석)(1) - Interaction(상호작용)

[기초통계학] One-way ANOVA(일원배치 분산분석) : ysyblog.tistory.com/174 [기초통계학] One-way ANOVA(일원배치 분산분석) (F-Value)One-way ANOVA 세 집단 비교 T-test는 두개 집단이 유사한지 아닌지 비교하는 것입니다. 그런데 만약 집단이 3개라면 어떻게 될까요. 물론 T-test를 3번하면 될것입니다. 하지만 그룹이 3개일때 t-test를ysyblog.tistory.com위의 일원배치분산분석 포스팅에서 이어집니다.Two-way ANOVA- 독립변수가 2개 + α 인 경우 사용하는 ANOVA입니다.- A라는 변수의 그룹들과 B라는 변수의 그룹들에 따라 종속변수가 변화할 것이라는 모델에서 사용- 여기서 독립변수는 Main Effect(주효과)가..

[기초통계학] One-way ANOVA(일원배치 분산분석) (F-Value)

One-way ANOVA 세 집단 비교 T-test는 두개 집단이 유사한지 아닌지 비교하는 것입니다. 그런데 만약 집단이 3개라면 어떻게 될까요. 물론 T-test를 3번하면 될것입니다. 하지만 그룹이 3개일때 t-test를 세번하면 1종오류에 걸립니다. 1종오류란 실제로는 유의하지 않은데 유의하다고 나온 경우를 말합니다. 5% p-value를 기준으로 세번의 t-test를 할턴데, 0.05라는 p-value를 세번 적용하기 때문에, 동원된 총 p-value 는 0.05*3 = 0.15입니다. 우리는 0.05라고 생각하고 적용하였지만 실제로는 0.15이기 때문에 1종오류가 생깁니다. 따라서 새로운 방법을 적용해야 합니다. 그것이 바로 One-way ANOVA입니다. One-way는 독립변수가 하나라는 뜻..

[기초통계학] T-test(가설검정 / One-Sample Test / Two-Sample T-test / Paired T-test)

T-test 모집단의 표준편차가 알려지지 않았을 때 정규분포의 모집단에서 모은 샘플(표본)의 평균값에 대한 가설검정 방법 T-test의 목적 -> 두개의 집단이 같은지 다른지 비교하기 위해 사용 -> 이를 알기 위해 두 집단의 샘플의 평균값을 비교하고, 두집단의 차이가 우연히 발생했을 확률을 구하므로서 t-test에 대한 결론을 구함 -> 즉, 두 집단의 평균값이 통계적으로 같은지 다른지를 확인 T-test를 위한 통계적 질문 - A대학 남학생 평균키(178.5cm)가 대한민국 평균키(179.9cm)와 우연히 같은 확률은 얼마나될까 - A대학의 남학생 평균키와 비교대상 평균키 차이인 1.4cm가 우연히 발생했을 확률은 얼마나 될까 - 그렇다면 과연 1.4cm차이가 얼마나 커야 우연히 발생하지 않았다고 판..

[기초통계학] 가설검정

가설검정 필요성1: 대부분의 분석은 "누구나" 할수 있는 "비교(A/B Test)"를 기반으로 하며, 일상생활부터 연구논문까지 다양 필요성2: "설명력"과 "(모델)복잡도"는 반비례하는 경향이 있으며, 설명력이 수반되는 모델들은 가설검정 해석이 필수 A의주장 : 서울에 사는 사람들은 한국사람이다. B의주장 : 서울에 사는 모든 사람이 한국사람은 아니다. 가설조건 1. 상호배반적(Mutually Exclusive): A의주장과 B의주장은 모호함 없이 독립적이어야 하며 더하면 다른주장은 없어야 함 - 한국사람은 어떻게 정의하나? 2. 증명가능성(Demostrable): 성급한 일반화에 빠지지 않으려면 증명 가능한 것이나 범위로 내세워야 함 모든 서울사람들을 확인하기도 어렵고 서울사람들 중에는 한국사람이 아닌..

[기초통계학] 확률분포

▣ 확률분포 ▶ 균등분포 : 과거의 경험이 미래를 예측하는데 어떤 영향도 미치지 않으며, 나타날 가능성이 모두 동일한 분포 이산균등분포 : 정의된 구간안에서 확률분포 함수의 모든 확률이 동일한 분포 → 확률변수 X의 확률함수는 1/n(주사위 던지는것과 같음) 연속균등분포 : 특정범위 내에서 모든 확률함수가 동일한 분포 EX) ▶ 정규분포 : 축적된 데이터를 기준으로 미래를 예측할 수 있는 분포 ▶ 표준정규분포 : 서로다른 정규분포를 비교할 수 있도록 여러개의 분포를 어떤 하나의 기준(평균=0, 분산=1)로 재배치해서 각 분초를 비교할수 있도록 표준화된 분포 ▶ 베르누이 시행 : 서로 반대되는 사건이 일어나는 실험을 반복적으로 실행 ex) 동전던지기, 주사위던지기(짝수,홀수) 베르누이 분포 : 성공확률을 ..

[기초통계학] 확률과 통계

▣ 확률과 통계 ▶ 확률의 조건 → 확률은 0~1의값을가지며 모두 더하면 1이다. ▶ 확률의 덧셈법칙 : 배반사건일 경우 두개확률을 더하면 총 확률이됨. EX. 배반사건 → 짝수 홀수 ▶ 확률의 곱셈법칙 : P(B∩A) = P(A) * P(B|A) ▶ 확률변수 이산확률변수 : 수집된 데이터의 확률변수 중 셀수 있는 특정한 값들로 구성되거나 일정한 범위로 나타나는 확률변수 연속확률변수 : 연속형이거나 무한한 경우와 같이 셀 수 없는 확률변수 ▶ 확률함수 : ex) P(X=2) = 1/4 → X는 확률변수 ▶ 기대값 : 어떤 사건에 대해 그 사건이 벌어질 확률을 곱해서 전체 사건에 대해 합한 값 사건에서 발생하는 해당 값과 그 사건이 발생할 확률을 곱해서 모두 더한 값 ex.) 주사위를 던졌을 때의 기대값 ..

반응형