我有一个关于治疗效果时间的问题,以及如何在面板数据集上使用差异估计量。
首先让我说我有一个大的公司级别的不平衡面板数据集,其中 N 大(7000 左右),T 小(从 3 到 28 不等)。我对分析特定政策干预的效果很感兴趣,但是,问题在于不同公司的治疗时机不同,我想知道如何(以及是否)可以在 DiD 框架中解释这一点。
据我了解,具有同时处理的一般 DiD 面板数据设置如下所示:
在哪里:
- 如果在治疗组中,Treat = 1,否则为 0
- After = 1 如果在政策干预之后,否则为 0
- 是控制向量,是参数/常数和是治疗效果
- FFE 是公司固定效应,TFE 是时间固定效应
在搜索了该站点后,我无法找到我完全理解的答案,但是,据我所知,这篇文章建议按照以下方式运行模型:
在哪里:
- “ ...policy 是每个人的虚拟变量,如果个人在政策干预/治疗后处于治疗组中,则等于 1... ”(来自上面链接的帖子)
- 年份是一组时间假人
我想我有两件事我不理解这种方法;
- 假人的构造. 这个虚拟变量是否只是在每个经过处理的公司进行时变处理后取值 1?或者帖子的作者是否意味着每家公司都有一个虚拟人指示治疗时间?
- 我的第二个问题与第一个问题有关,但更具概念性。据我了解,差异中的差异方法是关于在没有治疗的情况下使用未治疗作为治疗的反事实结果(假设平行趋势)。然而,在这种情况下,当不同公司的治疗时间不同时,对照组没有明确的“后期”,我相信这就是我在这里混淆的原因。上一个链接中建议的这种方法背后的概念是什么?这种方法是否可行,或者应该应用一些不同的识别策略?在那种情况下,考虑到这种情况,什么是合适的?
任何答案,对使用具有不同处理时间(最好是计量经济学性质)的面板数据集的论文或书籍的参考将不胜感激。
//比利
