|
3 | 3 | SCM(Structural Causal Model)은 변수 간의 causal mechanism을 구조방정식과 DAG로 표현하는 접근입니다. |
4 | 4 | 이 섹션에서는 주요 식별 전략을 중심으로, 실제 데이터를 활용한 인과효과 분석을 다룹니다. |
5 | 5 |
|
6 | | ---- |
7 | 6 |
|
8 | | -## 1. Backdoor Criterion |
| 7 | +- **Backdoor Criterion**: |
9 | 8 |
|
10 | | -- **식별 전략:** |
11 | | - 원인과 결과 모두에 영향을 미치는 교란변수(confounder) 를 통제하여, |
12 | | - 인과효과를 다음과 같이 식별합니다. |
| 9 | + 원인과 결과 모두에 영향을 미치는 교란변수(confounder) 를 통제하여, 인과효과를 다음과 같이 식별합니다. |
13 | 10 |
|
14 | | - $$ |
15 | | - P(Y \mid do(X)) = \sum_Z P(Y \mid X, Z) P(Z) |
16 | | - $$ |
| 11 | +$$ |
| 12 | +P(Y \mid do(X)) = \sum_Z P(Y \mid X, Z) P(Z) |
| 13 | +$$ |
17 | 14 |
|
18 | | -- **데이터:** *National Health and Nutrition Examination Survey (NHEFS)* |
19 | 15 |
|
20 | | ---- |
| 16 | +- **Frontdoor Criterion**: |
21 | 17 |
|
22 | | -## 2. Frontdoor Criterion |
| 18 | + 원인($X$)이 결과($Y$)에 미치는 효과가 매개변수($M$)을 통해서만 전달될 때, 다음 식을 통해 인과효과를 간접적으로 식별합니다. |
23 | 19 |
|
24 | | -- **식별 전략:** |
25 | | - 원인($X$)이 결과($Y$)에 미치는 효과가 매개변수($M$)을 통해서만 전달될 때, |
26 | | - 다음 식을 통해 인과효과를 간접적으로 식별합니다. |
| 20 | +$$ |
| 21 | +P(Y \mid do(X)) = \sum_M P(M \mid X) \sum_{X'} P(Y \mid M, X') P(X') |
| 22 | +$$ |
27 | 23 |
|
28 | | - $$ |
29 | | - P(Y \mid do(X)) = \sum_M P(M \mid X) \sum_{X'} P(Y \mid M, X') P(X') |
30 | | - $$ |
31 | 24 |
|
32 | | -- **데이터:** *NYC TLC 2023 High Volume FHV Trip Records* |
33 | | - |
34 | | ---- |
35 | | - |
36 | | -## 3. Instrument Variable (IV) |
37 | | - |
38 | | -- **식별 전략:** |
| 25 | +- **Instrument Variable (IV)**: |
| 26 | + |
39 | 27 | ($X$)와 ($Y$) 간의 내생성(endogeneity) 문제를 해결하기 위해, |
40 | 28 | ($X$)에는 영향을 주지만 ($Y$) 에는 직접 영향을 미치지 않는 도구변수($Z$)를 사용합니다. |
41 | 29 | 인과효과는 다음과 같이 식별됩니다. |
42 | 30 |
|
43 | | - $$ |
44 | | - \hat{\beta}_{IV} = \frac{\operatorname{Cov}(Z, Y)}{\operatorname{Cov}(Z, X)} |
45 | | - $$ |
46 | | -- **데이터:** 추후 확정 예정 |
| 31 | +$$ |
| 32 | +\hat{\beta}_{IV} = \frac{Cov(Z, Y)}{Cov(Z, X)} |
| 33 | +$$ |
47 | 34 |
|
48 | | ---- |
49 | | - |
50 | | -## 4. Causal Discovery |
51 | | - |
52 | | -- **목표:** |
| 35 | +- **Causal Discovery**: |
| 36 | + |
53 | 37 | score-based, constraint-based, function-based 등 탐색 알고리즘과 도메인 지식을 활용해 데이터로부터 인과 구조(DAG)를 도출합니다. |
54 | | - |
55 | | -- **데이터:** *UCI Auto MPG* |
0 commit comments