在通过替换匹配构建对照组的研究中,如何调整标准误?

机器算法验证 回归 聚类 采样
2022-04-04 22:04:43

我有 200 家公司的处理样本。我正在使用倾向得分匹配将每个治疗观察与一个对照配对(带替换抽样,以尽量减少与不良匹配相关的偏差)。这导致只有 102 家独特的控制公司的样本(其中许多与多个治疗观察结果相匹配)。我的最终样本包含 400 个观察值,其中大约 100 个是重复的。我的问题是,在回归框架中调整标准误差以解决这些重复观察中(完全)缺乏独立性的正确方法是什么?

1个回答

坦率地说,我认为没有任何合理的方法来计算标准误差。bootstrap 似乎是一种常用的方法,但 Abadie 和 Imbens (2008 Econometrica) 的论文证明了 bootstrap 遇到的问题。对于像 PS 匹配这样复杂的方法,我不完全确定 100 是一个足够大的样本量来为您提供渐近正态分布。– 斯塔斯克

如果平衡良好,并且使用协变量匹配以及倾向得分匹配,则样本对于非参数估计量(例如 Wilcoxon 符号秩检验)来说足够大。使用非参数估计器,置信区间覆盖将是正确的。这种方法的另一个优点是可以使用 Rosenbaum 界限测试对随机分配假设的敏感性。请参阅 Paul Rosenbaum 的 Observational Studies 或 Design of Observational Studies,后者更容易介绍。——杰森摩根