반응형

분류 전체보기 339

[기초통계학] Gambler's Ruin(도박꾼의 파산)

Gambler's Ruin(도박꾼의 파산) A와 B 두 명의 도박꾼이 매 라운드 $1씩 걸고 도박을 한다. 이긴 사람은 상대방의 $1을 가져가고, 둘 중 한 명이 가지고 온 돈이 바닥날 때까지 이 과정을 반복한다. $p = P(A가 어떤 라운드를 이긴다)$ $q = 1-p$ A는 i 달러, B는 N-i 달러를 가지고 게임을 한다고 할 때, p의 확률로 A가 1달러를 더 얻고, q의 확률로 1달러를 잃는다. 0, N은 흡수상태(absorbing state)라 하여, 게임 종료를 나타낸다. $p_i$​​ : A가 i 달러로 시작하여 게임을 이길 확률 $p_i = p \cdot p_{i+1}+q \cdot p_{i-1} ( 1 \le i \le N-1) 이고$ $ p_0 = 0 (A가 파산한 상태에서 시작하는..

[PostgreSQL] PostgreSQL의 특징과 장단점

PostgreSQL이란 오픈소스로 개발된 관계형 데이터베이스 ( ORDBMS) 다양한 영역에서 활용되고 있으며, 오라클/MySQL/MsSQL다음으로 많이 사용되는 RDBMS PostgreSQL 특징 1. 라이센스 비용이 전혀 들지 않음 PostgreSQL은 BSD(Berkeley Software Distribution) 라이센스를 활용하여 개발되었음 PostgreSQL은 자유로운 오픈 소스 라이선스를 통해 원하는 대로 DBMS를 사용, 수정 및 배포할 수 있음 따라서 데이터 volume가 커지더라도 라이센스 문제가 없기에, 기업에서는 부담이 전혀 없음 CF) BSD(Berkeley Software Distribution) BSD는 미국 캘리포니아 대학교 버클리의 CSRG(Computer System Re..

SQL & DB/PostgreSQL 2023.12.08

[인과추론] Structural Causal Model(SCMs) (구조적 인과모형)

Causality란?Correlation과 Causality만약 아래의 데이터가 있다고 가정할 때, 운동과 콜레스테롤 수치에 Correlation(상관관계)가 있는것으로 보이는데, 과연 운동을 많이할 수록 콜레스테롤 수치가 높다고 인과관계를 정의할 수 있는가데이터를 더 detail하게 뜯어보면, 나이에 따라 보면, 운동을 많이할 수록 콜레스테롤 수치가 줄어드는것으로 볼 수 있다.따라서 Correlation (상관관계)은 Casuality(인과관계)가 아니다.CounterfactualPotential Outcome(PO)X가 원인이고 Y가 결과이며, 만약 X가 x로 고정되었을때 (원인이 명확해졌을때)$Y_{X=1} = 1$ & $Y_{X=0} = 0 $X가 일어났으면 Y도 일어나며, X가 일어나지 않았을때..

[기초통계학] Monty Hall(몬티홀) 문제와 Simpson's Paradox(심슨의 역설)

Monty Hall 문제 세 개의 문 중에 하나 뒤에는 자동차가 있고, 나머지 두 개 뒤에는 염소가 있다. Monty가 내가 고르지 않은 문 중 하나를 열어 염소가 있는 것을 보여줬다면, 나는 처음 고른 문에서 바꾸는 것이 유리한가, 그렇지 않은가? 1. 수형도로 확인한다. CASE 1) 내가 고른문이 1번, 자동차가 있는 문이 1번인 경우 Monty는 2번이나 3번문을 열수밖에 없으며 각각의 확률은 1/2씩이다 CASE 2) 내가 고른문이 1번, 자동차가 있는 문이 2번인 경우 Monty는 3번문을 열어줄 수 밖에 없으며 확률은 1이다 CASE 3) 내가 고른문이 1번, 자동차가 있는 문이 3번인 경우 Monty는 2번문을 열어줄 수 밖에 없으며 확률은 1이다 여기서 내가 1번문을 선택했는데, Mont..

[PostgreSQL/MYSQL] 날짜/시간 계산(INTERVAL타입, age함수) (DATEDIFF, TIMESTAMPDIFF)

DATASET QUERYDROP TABLE IF EXISTS mst_users_with_dates;CREATE TABLE mst_users_with_dates ( user_id varchar(255) , register_stamp varchar(255) , birth_date varchar(255));INSERT INTO mst_users_with_datesVALUES ('U001', '2020-02-28 10:00:00', '2000-02-29') , ('U002', '2020-02-29 10:00:00', '1992-03-29') , ('U003', '2020-03-01 10:00:00', '2002-01-29') , ('U004', '2020-03-01 11:..

SQL & DB/PostgreSQL 2023.11.24

[기초통계학] 독립(Independence)과 조건부확률(Conditional Probability)(2) (전체 확률의 법칙, 수형도를 통한 조건부확률의 이해)

전체 확률의 법칙 A1, A2, A3, A4: 전체인 S를 분할한 것 (공간을 서로소 집합으로 분할) 주어진 자료로 문제를 잘 '분할'하여 접근하기 S를 $A_1, A_2, ... A_n$ 의 서로소인 분할들로 나누어 놓았다고 했을 때, $P(B) = P(B \cap A_1) + P(B \cap A_2) + ... + P(B \cap A_n)$ 가 성립하며, 이는 곧 $ = P(B|A_1)P(A_1) + P(B|A_2)P(A_2) +... + P(B|A_n)P(A_n)$ 로도 다시 쓰일 수 있다. 이를 전체 확률의 법칙(Law of Total Probability)라고 한다. 조건부 확률과 예시 조건부 독립: 'A와 B는 조건 C 하에서 독립이다' 정의) $P(A \cap B|C) = P(A|C)P(B|..

[수학 리부트] 삼각함수

삼각함수 일반각과 호도법 일반각 : $(360^\circ \times n) + \theta (n \in Z) $ 호도법 : 호의 길이로 각도를 표현하는 방법. 호도법으로 표현하는 각의 크기를 라디안(radian, 기호로 rad 라고 한다.) 라디안 : 각에 대응하는 호의 길이를 원의 반지름으로 나눈 것. $360^\circ = \frac{2πr}{r} = 2π (rad)$ 라디안과 도 단위 사이에는 다음 관계가 성립한다 $180^\circ = π (rad)$ => $1^\circ = \frac{π}{180} (rad)$ => $1(rad) = \frac{180}{π} \approx 57.3^\circ$ 호도법에서의 각의 크기 : $2nπ + \theta (n \in Z) $ 각도법 대신 호도법을 쓰는 이..

[기초통계학] 독립(Independence)과 조건부확률(Conditional Probability) (1)

독립 (Independence) 정의) $P(A \cap B) = P(A)P(B)$이 성립할 때, 사건 A와 B는 독립이다. 주의하기: 서로소(disjoint) 와 구별하기 – A와 B가 서로소인 사건이라면, A가 발생했을 때 B는 발생할 수 없다. (한편, A와 B가 독립이라면, 사건 A의 발생은 B의 발생여부에 대한 그 어떤 영향도 끼치지 않음) $P(A \cap B) = P(A)P(B)$ $P(B \cap C) = P(B)P(C)$ $P(C \cap A) = P(C)P(A)$ $P(A \cap B \cap C) = P(A)P(B)P(C)$ 가 모두 성립할 때, 사건 A, B, C는 독립이다. → 쌍으로 독립(pairwise independence)과 전체 독립 모두 확인해야 A, B, C의 독립을 ..

[기초통계학] 확률의 non-naïve한 정의의 공리, 확률의 특성, 포함배제의 원리

Non-naïve definition of probability 모든 경우의 확률이 각각 다른 경우 확률공간(Probability space) : S와 P로 구성 S : 표본공간 (어떤 사건 A는 S의 부분집합) P : 함수 (어떤 사건 A를 입력으로 하는 함수) 공리 아래 세 가지 공리로부터 대부분의 식을 유도할 수 있음 공집합에 대한 확률은 0이다 (불가능하기 때문에) $P(S) = 1P(ϕ)=0$ 전체 표본 공간의 확률(적어도 사건 A가 발생할 확률)은 1이다. P(S)=1 합사건의 확률은 모든 확률의 합과 같다. (A1, A2.... 가 모두 서로소 일 경우만) $P(\bigcup_{n=1} ^\infty A_n) = \displaystyle\sum_{n=1} ^\infty P(A_n)$ $A_i..

[기초통계학] 확률의 기본 개념(표본공간, 곱의 법칙, 이항정리), 표본추출정리, 확률의 공리

확률론의 활용영역 유전학, 물리학, 계랑경제학, 금융, 역사학, 정치 인문학, 사회과학계에서도 중요도와 활용이 늘어나고 있음 도박과 게임 - 통계에서 여러 번 연구된 주제이다(페르마, 파스칼) 인생 전반: (수학이 활실성에 대한 학문이라면,) 확률은 불확실성(uncertainty)을 계량화하는 것을 가능하게 해 준다. 확률의 기본 개념 표본공간(sample space): 시행에서 발생 가능한 모든 경우의 집합 사건(event): 표본공간의 부분집합 확률의 naïve 한 정의 $P(A) = \frac{(사건 A가 발생하는 경우의 수)}{(발생 가능한 모든 경우의 수)}$ 분모는 표본공간과 같음 두개의 동전을 던졌을 때 둘다 앞면이 나올 확률 : $P(A) = \frac{1}{4}$ 가정 : 모든 경우가 같..

반응형