반응형

선택편향 3

[인과추론] 그래프 인과모델

그래프 인과모델그래프 인과모델은 인과추론 문제를 구조화하며 식별과정을 명쾌하고 시각적으로 표현해줌구조적 인과모델(Structural causal model, SCM) : 그래프(DAG)와 인과방정식(Causal equation)으로 구성됨. 인과관계 시각화이전 포스팅에서 사용했었던 어떤 이메일이 전환을 많이 일으키는지를 예시로 사용.측정하지 않는 변수를 그래프에 추가할 수 있음, 이 변수는 관측되지 않으니 U로 표시EX) 고객소득, 사회적배경, 나이 등 -> 이를 모두 묶어서 U로 표시무작위로 배정되거나 개입된 변수를 표현할 때는 들어오는 화살표를 모두 제거하면됨중요한 것은 DAG에서 가장 중요한 정보는 그래프안에 없을 수 있다는 것.한 변수에서 다른 변수로 연결되는 엣지가 없다는 것은 두 변수 사이에 ..

[기초통계학] 통계학과 자료 / 선택편향과 생존편향

통계학이란 통계학은 자료를 정리/분석해 유용한 정보를 얻기 위한 언어이자 도구 통계학의 분류 통계학은 크게 두 가지로 분류할 수 있다. 기술통계학 (descriptive statistics) 자료를 변수 별로 따로따로 또는 관계되는 변수끼리 묶어서 요약 추론통계학(inferential statistics) 정리된 자료에 담긴 의미를 해석하여 미지의 세계에 대해 추론 모집단과 표본사이의 관계 통계학은 표본의 자료를 수집, 정리, 요약 나아가 요약된 자료를 토대로 그 자료의 모태가 되는 모집단에 대해 짐작, 추측해 보는 작업을 포함 자료의 종류 횡단면 자료(cross-sectional data) 한 시점에서 여러 개체를 관측한 자료. 시계열 자료(time-series data) 한 개체를 여러 시점에 걸쳐 ..

[인과추론] 인과관계를 알아내기 위한 분석틀

인과관계를 이해하는 틀 잠재적 결과 프레임 워크 인과 효과 = (원인이 있을 때의 결과) - (원인이 없었다면 있었을 잠재적 결과) 잠재적인 결과는 “관찰되지 못한”가상의 결과이다 EX) 비료의 사용과 농산물 생산량의 관계에서 인과관계를 분석할때 비료를 사용한 생산량은 100인데, 만약 연초에 비료를 쓰지 않았다면 생산량은 어땠을까 인과추론의 근본적 문제 잠재적인 결과는 "관찰되지 못한" 가상의 결과 (Fundamental Problem fo Causal Inference) EX) 독서와 성적의 관계 보통 사람들이 생각하는 인과관계 : (책을 읽은 우리 아이의 성적) - (책을 읽지 않은 우리 아이의 성적) 실제 현실에 나타난 결과 : (책을 읽은 엄마 친구 아들 성적) - (책을 읽지 않은 우리 아이 ..

반응형