为了补充兰登的回答,让我进一步详细说明。
因果推理总是需要不可检验的假设,通常的假设是变量之间没有直接影响(排除限制)或变量之间没有未观察到的共同原因(独立性限制)。现在,让我们专注于这两者的违反,但是,当然,还有其他内置的假设,例如没有选择偏差、正确测量的变量、单位之间没有干扰等等。
所以我要指出的第一件事是,DAG 作为模型,在“所有模型都是错误的”座右铭下没有特殊地位——如果你不写下模型的隐含 DAG,你的模型仍然是“错误”(或者,更好的是,“没用”)。Wherr DAG 的真正帮助在于让您(和您的同行)更容易发现您的模型可能出错的地方,并更好地确定分歧的来源。然后,您可以评估您的结论是否对这种分歧敏感。
要执行此任务,我们需要工具来导出因果模型中感兴趣的目标数量的敏感性曲线。关于线性结构模型,我们刚刚开始开发使这种敏感性分析自动化和系统化的算法。例如,举个例子:

假设您假设模型对的因果影响已确定(并由调整的回归系数给出)。现在有人挑战您并说您假设和之间没有未观察到的混杂因素是不合理的,这导致了替代模型模型。然而,在中,因果效应不再可识别。所以,你可以做什么?这就是敏感性分析的用武之地。GOXYZZXGAGA
不是点识别因果效应,而是将因果效应表达为模型中其他无法识别的参数的函数——例如未观察到的混杂因素的强度。然后,您可以看到您的结论对该参数的不同强度有多敏感,并借助外部知识和对这些参数的科学合理性判断来限制感兴趣的因果效应。
所以我们需要解决的第一个任务是确定一些参数的信息,比如,X和Z, 足以识别感兴趣的数量并找到正确的估计值。完成此操作后,您可以使用它来查看您的估计对违反零混杂假设的敏感性。
所以,回到这个例子,在GA, 你能用这些信息来限制因果关系吗X上Y? 这里的答案是肯定的,我们可以通过算法推导出灵敏度曲线(如果模型是GB,答案是否定的)。但是假设你没有关于混杂因素本身的直接外部信息,但你确实有一些先前的研究,这些研究对Z上X. 我们可以使用该信息进行敏感性分析吗?X和Y反而?这里的答案也是肯定的。通过这种方式,我们正在构建工具,以对违反任意因果模型(以 DAG 为代表)的假设进行有纪律的讨论。