인과추론 | Chapter 5. 성향점수 성향점수5.1 관리자 교육의 효과[ 관리자 교육의 효과 실험 ]목적 : 관리자 교육과 직원 참여도 간의 인과관계 추정프로그램에 등록된 관리자의 직원들과 등록되지 않은 직원들에 대한 참여도 비교실험 설계 : 관리자들을 무작위로 프로그램에 참여시키기 → 불응 발생 (프로그램에 참여해야 할 관리자는 참여X, 참석 대상이 아닌 관리자는 참여O) → 교란 요인 발생 (처치가 무작위로 배정되지 않음) 교란 요인을 보정해 실험군과 대조군을 비교할 수 있도록 해야 함. 5.2 회귀분석과 보정성향점수 가중치 추정값이 회귀 추정값과 같은지 확인해보기[ 회귀 추정값으로 교란요인 보정 ]실험군과 대조군을 단순 비교하면 편향된 결과가 나옴데이터에 있는 공변량을 .. 인과추론 | Chapter 4. 유용한 선형회귀 (2) 4.6 선형회귀에서의 비선형성 유일한 교란요인을 임금이라고 가정신용한도가 소비에 미치는 영향을 파악하려면 임금(공통원인)을 통제해야 함.효과 추정에 직교화를 사용하고 싶으면, 신용한도를 임금에 회귀하고 그 잔차를 구해 신용한도의 편향을 제거해야 함.1234567891011121314151617# 데이터 가져오기 (risk_data) import pandas as pdimport numpy as nprisk_data = pd.read_csv('./data/risk_data.csv') # 신용한도-임금 편향제거 모델import stats.. 인과추론 | Chapter 4. 유용한 선형회귀 (1) 4.1 선형회귀의 필요성▶ 회귀 모델이 필요한 이유처치가 무작위 배정된 것처럼 보이도록 변수를 보정하는 공식$ ATE = E_{x} \{{E[Y | T=1, X=x] - E[Y | T=0, X=x]}\} $여기에 조건부 독립성 가정 $ (Y_{0}, Y_{1}) ⊥ T | X $ 이 만족되면 인과효과를 식별할 수 있음하지만 차원의 저주 때문에 공변량이 많을 때 보정공식을 그대로 적용하면 데이터 희소성 문제를 겪을 수 있음차원의 저주란, 차원이 증가하면서 학습 데이터의 수가 차원 수보다 적어져서 성능이 저하되는 현상을 말함차원의 저주에서 벗어나는 방법은 잠재적 결과를 선형회귀 같은 방식으로 모델링할 수 있다고 가정하고, X로 정의된 각각의 셀을 내삽(interpolate)하고 외삽(extrapolate)하.. 인과추론 | Chapter 3. 그래프 인과모델 인과추론의 문단속3.1 인과관계에 대해 생각해보기연관관계가 인과관계가 되기 위해서는 처치가 잠재적 결과와 독립이라는 가정이 필요함그런데 여기에서 독립성 가정이 성립하기 위해서는 실험 대상에게 처치 배정에 관한 매커니즘 정보가 있어야 함 3.2 그래프 모델 집중 훈련(p.104) 그래프의 각 노드는 확률변수그래프 모델에 어떤 독립성 및 조건부 독립성 가정이 수반되는지 이해하는 것이 중요함 인과관계는 화살표 방향으로만 흐르지만, 연관관계는 양방향으로 흐름사슬구조분기구조충돌부 구조T ⊥ Y | MT ⊥ Y | XT ⊥ Y• M은 중간노드로서 T와 Y를 매개하는 역할이므로 매개자(mediator)라고 함 • 매개자 M을 고정하면(조건부로 설정하면) T와 Y 사이의 종속성이 차단되며 T와 Y가 독립이 됨 • 분.. 인과추론 | Chapter 2. 무작위 실험 및 기초 통계 리뷰 2.1 무작위 배정으로 독립성 확보하기잠재적 결과와 처치가 독립인 경우, 연관관계는 인과관계와 동일해짐$ (Y_0, Y_1) ⊥ T $처치와 결과 사이의 독립성을 말하는 것이 아님처치와 결과가 독립적이라는 것은 처치가 있든 없든 결과가 달라지지 않는다는 것. 처치와 잠재적 결과가 독립적이라는 것$ Y_1 ⊥ T $ : 실험 대상이 처치 받았더라면 관측되었을 결과가 실제로 처치 받앗는지 여부와 무관하다는 뜻$ Y_0⊥ T $ : 실험 대상이 처치 받지 않앗을 경우 관측되었을 결과가 실제 처치 여부와 무관하다는 뜻즉, 실제 관측된 결과 Y는 처치 여부에 따라 달라지는 것 → 실험군과 대조군이 비교 가능함을 뜻함처치를 무작위로 배정(RCT : randomized control trial) 하면 실험군과 대조군.. 인과추론 | Chapter 1. 인과추론 소개 통제 가능한 요소(마케팅 예산과 신용 한도)들을 변경했을 때, 원하는 비즈니스 결과(유입 사용자 수와 채무불이행 위험)에 어떤 영향을 미치는지 알아야 한다는 것 1.1 인과추론의 개념연관관계 : 두 개의 수치나 확률변수가 같이 움직이는 것인과관계 : 한 변수의 변화가 다른 변수의 변화를 일으키는 것인과추론은,연관관계로부터 인과관계를 추론하고,언제 그리고 왜 서로 다른지 이해하는 과학 1.2 인과추론의 목적원인과 결과의 관계를 알아야만 원인에 개입하여 원하는 결과를 가져올 수 있음>> 이 책은 개입의 영향을 이해하는 데에 중점을 둔 인과추론의 일부를 다룸 1.3 머신러닝과 인과추론머신러닝을 잘 활용하려면 문제를 예측문제로 구성해야 함문제점예측에 사용하는 변수에 개입이 발생하면 해당 예측 모델로 목적을 달성.. 이전 1 다음