将因果推理与实验、准实验和非实验技术进行比较的最佳实证研究是什么?

机器算法验证 参考 因果关系 随机分配
2022-04-10 03:56:19

问题:人们试图使用许多不同的统计技术(例如回归、倾向得分匹配、回归不连续性、工具变量等)得出因果推论。了解用于因果推理的不同统计技术的优缺点的一种好方法是在相同的数据上比较它们。由于随机实验是因果推理的所谓“黄金标准”,因此它们显然是一个极好的基准。

我看过几项关于这最后一种类型的研究,但我只能回忆起两个。LaLonde 的经典著作:“ Evaluating the Econometric Evaluations of Training Programs with Experimental Data ”和 Aiken 等。人。在单一结果评估中比较随机和两个准实验设计:大学水平的补习写作计划的功效。”

你知道这类研究的其他例子吗?

3个回答

您所指的研究类型称为研究内比较。一个引起大量讨论的早期例子是Dehejia 和 Wahba (1999; JASA) 使用 Lalonde (1986) NSW 的数据,他们将基于 PSA 的结果与随机实验基准进行了比较。Lalonde 数据集现在包含在 R 中的 PSA 包中,例如 Matching 和 twang。西北大学有一个正在进行的研讨会(不确定他们是否仍然这样做),其中有一个存档网站,其中包含您会发现有用的参考列表(链接)

一个有趣的例子是Shadish、Clark 和 Steiner在 2008 年发表的 JASA 论文,他们将参与者随机分配到观察性研究或随机实验中,然后使用随机实验的结果作为基准,正如你所说。更典型的设计是三组(随机治疗 gp、随机对照组、观察对照组)。Shadish、Clark 和 Steiner 的设计是四组(随机治疗 gp、随机对照组、观察治疗 gp、观察对照组)。

在医学方面,我所知道的最新和全面的工作是由OMOP(观察性医学结果伙伴关系)完成的。你会在他们的出版物页面上找到很多相关的研究,我认为评论论文“评估观察性研究证据的系统统计方法”很好地概述了该项目及其发现。

最新的诺贝尔经济学奖获得者安格斯·迪顿(Angus Deaton)在此链接中就他对 RCT 作为黄金标准的想法进行了采访。他非常令人耳目一新地持怀疑态度,指出 RCT 中通常较小的样本量与观察性研究提供的全国可预测估计值相比,并得出结论:“我认为证据质量或有用性方面没有差异。有各种糟糕的研究。”

https://medium.com/@timothyogden/experimental-conversations-angus-deaton-b2f768dffd57#.t41xnnnd5