工具变量的直观解释

机器算法验证 因果关系 工具变量 混杂 内生性 外生性
2022-03-30 14:54:22

这是我多年前在MSc Economics中处理过的事情,并以优异的成绩通过了考试,但是当我今天更深入地考虑它时,我有些困惑。这可能是因为我上次讨论这个话题已经过去几年了,也可能是因为我只学习了理论而从未处理过实际例子;不管有什么直观的解释,用数学证明加强将不胜感激。

一般的想法是,对于,外生性假设必须成立 -ie当违反这个假设时,我们找到一个工具,使得,而换句话说,是相关的,但是当相关时,不是!我看不出这是怎么回事。还是该假设与“完美”共线性有关?就像在中一样,仍然与y=βx+εE{x(yβx)}=0E{x(yβx)}0zE{z(yβx)}=0E{xz}0xzxεzzε,但与的程度不同?谢谢!x

2个回答

我认为最直观的解释在于 Judea Pearl 采用的因果有向无环图 (DAG) 方法,其中表示导致工具变量的典型设置如下:ABAB

在此处输入图像描述

这里未测量的变量是导致问题的变量,因为它设置了从因此是一个真正的混杂因素。你不能以它为条件,因为它是不可测量的。因此,您会发现一个工具变量仅对在任一方向上都没有因果影响。可能不相关的原因​​ 处的对撞机会阻止因果信息从流向EXY,ZXEYZEZXE,XZE.同样,如果您检查路径处的对撞机会阻止信息流动。到E没有其他路径因此不可能有从的信息流,反之亦然。ZXYE,YZE,ZE

顺便说一句,有时也可以使用前门方法如果您可以之间EZXY

在此处输入图像描述

然后可以调用前门调整公式: 不幸的是,这并不总是可能的。

P(Y|do(X))=zP(Z=z|X)xP(Y|X=x,Z=z)P(X=x).

我也很难直观地理解 IV 方法。解释很少,值得考虑。让我向您介绍我自己找到的一个,这对我来说很有说服力。

首先,对我来说,@Adrian Keister 完美描述的 DAG 范式是理解这里发生了什么的关键。它有助于理解排除限制假设,以及Brito 和 Pearl (2012)中描述的其他工具变体。

因果图以方便的方式引入了中介让我们从中介的角度看一下工具变量的经典因果模型:

在此处输入图像描述

我们要识别的影响是,它是X对Y的“真实”影响。如上一个答案所述,由于存在未测量的混杂因素C,因此无法直接识别。β

然而,我们可以在某种程度上理解它,X介导了 Z 对 Y 的影响。

在此设置效果中,X 上的 Z 被正确识别,它等于此外,Z 对 Y 的影响被正确识别,它等于ααβ

因此,如果我们想计算,我们可以简单地将第二个模型的估计量除以第一个模型的估计量。该过程将与估计前门标准中的效果类似。β

那么在 2SLS 过程中会发生什么?在我的直观理解中,我们仍然估计 Z 对 Y 的影响,但是它包括已经强制已经包括 参数。在第二阶段回归中剩下的只是αβ


布里托、卡洛斯和朱迪亚·珀尔。“广义工具变量。” arXiv 预印本 arXiv:1301.0560 (2012)。