인과추론의 문단속
3.1 인과관계에 대해 생각해보기
연관관계가 인과관계가 되기 위해서는 처치가 잠재적 결과와 독립이라는 가정이 필요함
그런데 여기에서 독립성 가정이 성립하기 위해서는 실험 대상에게 처치 배정에 관한 매커니즘 정보가 있어야 함
3.2 그래프 모델 집중 훈련
(p.104) 그래프의 각 노드는 확률변수
그래프 모델에 어떤 독립성 및 조건부 독립성 가정이 수반되는지 이해하는 것이 중요함
인과관계는 화살표 방향으로만 흐르지만, 연관관계는 양방향으로 흐름
사슬구조 | 분기구조 | 충돌부 구조 |
![]() |
![]() |
![]() |
T ⊥ Y | M | T ⊥ Y | X | T ⊥ Y |
• M은 중간노드로서 T와 Y를 매개하는 역할이므로 매개자(mediator)라고 함 • 매개자 M을 고정하면(조건부로 설정하면) T와 Y 사이의 종속성이 차단되며 T와 Y가 독립이 됨 |
• 분기 끝에 있는 변수들은 서로의 원인이 아니더라도 같은 원인으로 발생하므로 함께 움직임 • 일반적으로 분기 구조에서 공통 원인을 공유하는 두 변수는 종속이지만, 공통 원인이 주어지면 독립임 • T와 Y는 종속되어 있지만 X가 주어진 경우 T와 Y가 독립이 됨 |
• 두 노드가 하나의 자식을 공유하지만 그들 사이에는 직접적인 관계가 없는 경우 • 두 변수가 공통의 효과를 공유하는 경우 두 개의 화살표가 충돌하므로 충돌부라고 함 • 충돌부 구조에서 두 부모 노드는 서로 독립이지만 공통 효과를 조건부로 두면 연관 경로가 열리면서 서로 종속이 됨 |
▶ (예시) 그래프 모델 해석_독립/종속
[가로 버전 그래프]![]() [세로 버전 그래프] ![]() |
문제 | 정답 |
D와 C는 종속일까요? | (충돌부 구조) 독립 | |
A가 주어진 경우, D와 C는 종속일까요? | (충돌부 조건) 종속 | |
G가 주어진 경우, D와 C는 종속일까요? | (충돌부 효과에 대한 조건) 종속 | |
A와 B는 종속일까요? | (분기 구조) 종속 | |
C가 주어진 경우, A와 B는 종속일까요? | (공통원인 조건) 독립 | |
G와 F는 종속일까요? | 독립 • G와 E는 분기에 있어서 연관성이 흐름 • 이 연관성은 충돌부 E에서 멈춤 • 이는 G와 F가 독립임을 의미 |
|
E가 주어진 경우, G와 F는 종속일까요? | 종속 • E를 조건부로 두면 연관성이 충돌부로 흐르며 G와 F가 연결됨 |
3.3 식별 재해석
식별은 처치와 결과 간의 인과관계를 분리하는 과정
식별 단계에서는 바람직하지 않은 모든 연관성을 차단함
▶ (예시) '컨설팅'과 '기업의 미래 실적' 사이의 관계
# 그래프 해석
- 한 회사의 이전 6개월 수익이 좋으면 컨설턴트를 고용할 수 있음
- 컨설턴트 고용으로 인해 이후 6개월의 수익이 좋을 수 있음
- 이전 6개월의 수익이 좋으면 이후 6개월의 수익이 좋을 확률이 높음
# 식별 재해석
- 해당 그래프는 분기구조를 띄고 있음
- 인과 경로 : 직접적인 경로
- 비인과 경로(뒷문 경로 : backdoor path) : 공통 원인으로 교란받는 비인과 경로
- 공통 원인이 되는 회사의 과거 실적을 조건으로 하면 뒷문 경로가 닫히게 됨
- 즉, 컨설팅(처치)과 회사의 미래 실적(결과) 사이의 비인과 연관성 흐름이 차단됨
- 그 결과, 과거 실적이 비슷한 회사들의 그룹을 살펴보고 컨설턴트 여부에 따른 회사의 미래 실적을 비교하면, 그 차이는 전적으로 컨설턴트 때문에 발생했다고 볼 수 있게 됨
- 실험군(컨설턴트 고용 회사)과 대조군(컨설턴트 고용 안한 회사) 사이의 미래 실적 차이는 (1) 컨설팅(처치) 때문에 (2) 컨설턴트를 고용한 회사가 처음부터 잘하는 경향이 있기 때문에 발생하는 것. 하지만 회사의 과거 실적이 비슷한 실험군과 대조군을 비교하게 되면 (2)번의 원인은 사라지게 됨
3.4 조건부 독립성 가정과 보정 공식
▶ 조건부 독립성 가정(CIA : conditional independence assumption)
_ 무시 가능성(ignorability), 외생성(exogeneity), 교환 가능성(exchangeability)
$ (Y_{0}, Y_{1}) ⊥ T | X $
: 공변량 X 수준이 동일한 대상(회사)을 비교하면 잠재적 결과는 평균적으로 같음을 의미함
즉, 공변량 X 값이 동일한 대상을 보면 처치가 마치 무작위로 배정된 것처럼 보임
▶ 보정 공식 (또는 조건부 원칙)
$ ATE = E_{X}[E[Y | T=1] - E[Y | T=0]] $
$ ATE = \sum\limits_{x} ([E[Y | T=1, X=x] - E[Y | T=0, X=x]]) P(X=x) $
$ = \sum\limits_{x} ([E[Y | T=1, X=x] P(X=x) - E[Y | T=0, X=x]]) P(X=x) $
: X로 정의된 각 그룹 내에서 실험군과 대조군을 비교하고
각 그룹의 크기를 가중치로 사용해서 해당 결과의 평균을 구하는 방법
[질문]
(p. 120)
조건부 독립성 가정이 제시하는 방법에서 각 그룹의 크기를 가중치로 사용한다고 하는데
이 때의 그룹의 크기는 해당 그룹 안에 나눠놓은 실험군과 대조군 크기의 차이를 말하는 건지? O
아니면 X1, X2 그룹에 속한 표본의 개수 크기?
3.5 양수성 가정
_ 공통 지지(common support), 중첩(overlap)
- 처치와 결과 사이의 차이를 X에 따라 평균을 내기 때문에
그룹 간의 차이를 정의하기 위해서는 X의 모든 그룹에 실험군과 대조군의 실험 대상이 반드시 존재해야 함. - 처치의 조건부 확률은 반드시 양수이고 1 미만이어야 함 (0 < P(T | X) < 1)
- 양수성 가정을 위배해도 식별이 가능하지만 위험한 외삽(extrapolation)을 해야할 수 있음
3.6 구체적인 식별 예제
- 수익이 낮은 회사 3개, 높은 회사 3개
- 수익성이 낮은 회사 중 1개 회사만 컨설턴트 고용
- 수익성이 높은 회사 중 2개 회사가 컨설턴트 고용
# 데이터프레임 생성
1 2 3 4 5 6 | # 데이터프레임 생성 df = pd.DataFrame(dict( profit_prev_6m = [1.0, 1.0, 1.0, 5.0, 5.0, 5.0], consultancy = [0, 0, 1, 0, 1, 1], profits_next_6m = [1, 1.1, 1.2, 5.5, 5.7, 5.7] )) | cs |
# 컨설턴트 사용(및 회사규모) 에 따른 미래실적 평균 차이
1 2 3 4 5 6 7 8 | # 컨설턴트를 고용한 회사와 그렇지 않은 회사 단순 비교 (df.query("consultancy==1")["profits_next_6m"].mean() - df.query("consultancy==0")["profits_next_6m"].mean()) # output : 1.666666666666667 # (컨설턴트 고용 + 과거실적)에 따른 미래실적 차이 비교 avg_df = (df.groupby(["consultancy", 'profit_prev_6m'])["profits_next_6m"].mean()) avg_df.loc[1] - avg_df.loc[0] | cs |
![]() |
avg_df.loc[1] | ![]() |
avg_df.loc[0] | ![]() |
|
avg_df.loc[1] - avg_df.loc[0] |
![]() |
3.7 교란편향
교란(편향)은 대게 비인과적으로 연관성이 흐르는 열린 뒷문 경로가 있을 때 발생함
일반적으로 처치와 결과가 공통 '원인'을 공유하기 때문임
교란 편향을 보정하려면 처치와 결과의 공통 원인을 보정해야 함
- 대리 교란 요인
- 공통 원인이 측정할 수 없는 경우에 측정이 가능한 대리변수를 통제해 편향을 줄일 수 있음
- 랜덤화 재해석
- 실무에서는 회사가 통제할 수 있는 요소(가격, 고객 서비스, 마케팅 예산 등)의 인과 효과를 확인할 수 있기 때문에 일반적으로 처치를 배정하는 데 사용하는 정보를 알 수 있음 → 교란 요인 파악이 용이
- 그렇지 않은 경우에 처치를 무작위로 배정하면 관측할 수 없는 교란 요인이 있는 그래프에서 처치의 유일한 원인이 랜덤성인 그래프로 바꿀 수 있음
- 민감도 분석과 부분 식별
- 민감도 분석 : '측정되지 않은 교란 요인이 분석 결과를 크게 바꾸려면 얼마나 강력해야 하는가'
- 부분 식별 : 관심있는 인과 추정량을 정확히 식별할 수 없을 때 관측 가능한 데이터를 사용해 주변 경계를 설정할 수 있음
3.8 선택편향
교란편향은 처치와 결과의 공통 '원인'을 통제하지 않았을 때 발생
선택편향은 공통 '효과'와 매개자에 대한 조건부와 더 밀접한 관련이 있음
▶ 충돌부 조건부 설정
직접적인 인과 경로를 삭제하고 처치와 결과가 여전히 연결되는지 확인하는 접근법
'신규 기능.. 과연 고객의 만족도와 행복감을 높였는가. 그것이 알고싶다'
_ (문제) 신규기능이 NPS에 미치는 인과효과가 있을까?
_ (정답 스포) 없음. 설문에 응답한 사람들에게서만 NPS를 측정할 수 있기 때문
- 처치 : 신규 기능
- 실험군 : 신규기능 사용자 (고객 중 10%는 무작위로 신규기능 사용)
- 대조군 : 신규기능 사용 안한 자
- 대리변수 : 순고객추천지수(NPS : net promoter score)
[질문]
(p.128)
공통 효과에 조건부를 두면 선택편향도 생깁니다.
그다음 응답을 조건부로 두면 NPS가 여전히 신규 기능과 연결되는지 확인할 수 있습니다.
이는 비인과 경로로 두 변수 간에 연관성이 흐름을 의미하며, 이것이 바로 편향입니다.
(위 세 문장을 이해해보려는 흔적..)
무작위 배정을 통해 ATE를 실험군과 대조군 간의 결과 차이로 식별할 수 있지만
공통'효과'를 조건부로 두면 선택편향이 생긴다.
신규기능 → 고객 만족도 ↘
설문응답
신규기능↗
신규 기능에서 고객 만족도로 가는 인과경로 삭제 (NPS로 가는 직접적인 경로가 닫히게 됨)
신규기능 ↘
설문응답 (충돌부)
고객 만족도 ↗
(분기) ↘
NPS
현재 [설문응답]이 충돌부(공통효과)
→ [설문응답]을 조건부로 두면 / NPS가 여전히 신규기능과 연결되는지 확인 가능
→ [설문응답]을 조건부로 두면 / 신규기능과 고객만족도 사이에 종속이 생기고, 고객만족도는 NPS와 설문응답의 공통원인이기 때문에 고객만족도가 종속이 되면 NPS도 종속되어 결국 [신규기능~NPS]로 이어지는 흐름이 생기게 됨
이것이 비인과 경로이고, 두 변수(NPS와 신규기능) 간에 연관성이 흐름을 의미함
이것이 편향임
(p.130) 고객 만족도가 영향을 미치면 편향은 0이 되지 않습니다.
만족한 고객은 응답할 가능성이 더 높으므로 이 상황에서는 식별할 수 없습니다.
처치인 신규기능이 만족도를 높인다면, 대조군에는 실험군보다 기준 만족도가 높은 고객이 더 많이 포함될 것입니다.
실험군에는 만족한 고객(기준 만족도가 높은 고객)과 기준 만족도가 낮았으나 처치 덕분에 만족도가 높아져 설문에 응답한 고객이 포함되기 때문입니다.
▶ 선택편향 보정
앞의 예시를 이어서 보자면
무작위 통제 실험을 하더라도 ATE를 식별할 수 없음.
설문에 응답한 사람들을 조건으로 설정하면, 신규 기능과 고객 만족도 사이에 연관성 흐름을 차단할 수 없기 때문.
식별을 위해서는 결과가 선택을 야기하지 않는다고 가정해야 함
이 예시에서는 고객 만족도가 설문에 응답할 가능성을 높이거나 낮추지 않아야 한다는 것을 의미
(즉, 고객 만족도처럼 누군가의 선호도를 설문응답의 원인으로 두면 설문에 응답한 사람들의 결과만 확인할 수 있게 됨. 그러면 편향이 생김. 그렇기 때문에 편향을 유발하지 않는 중립적인 관측 가능한 변수를 사용하는 게 좋다는 말이라고 해석됨)
더 정확히는 선택과 결과 모두를 유발하는 다른 관측 가능한 변수들을 사용해야 함
ex. 고객의 앱 사용시간과 신규기능
앱 사용시간을 통제해서 신규 기능이 만족도에 미치는 영향을 식별할 수 있음
# 선택편향을 보정하기 위한 가정
- 선택을 유발하는 모든 요인을 보정해야 함
- 결과나 처치가 직접 선택을 유도하거나 선택과 숨겨진 공통 원인을 공유하지 않는다고 가정해야 함
- 선택을 설명하는 변수를 조건으로 두는 방법이 최선임
▶ 매개자 조건부 설정
지금까지의 선택편향은 불가피한 모집단의 선택 때문에 발생한 것
그러나 의도치 않게 선택편향이 발생할 수 있음
→ 매개자로 인한 편향, 매개자의 자식이 조건부로 주어졌을 때의 편향(이러한 선택은 인과 경로를 완전히 차단하지는 않지만 부분적으로 차단함)
'통계학, 인과추론 스터디 > 인과추론' 카테고리의 다른 글
인과추론 | Chapter 5. 성향점수 (3) | 2024.10.07 |
---|---|
인과추론 | Chapter 4. 유용한 선형회귀 (2) (1) | 2024.09.30 |
인과추론 | Chapter 4. 유용한 선형회귀 (1) (2) | 2024.09.23 |
인과추론 | Chapter 2. 무작위 실험 및 기초 통계 리뷰 (0) | 2024.09.09 |
인과추론 | Chapter 1. 인과추론 소개 (9) | 2024.09.02 |
댓글