差异与交互的差异

机器算法验证 回归 相互作用 面板数据 差异中的差异
2022-04-10 20:08:29

我正在尝试使用差异估计量的差异来估计因果关系。我怀疑对小型和大型公司会有不同的影响。我对这种不同的效果很感兴趣。我想知道它在统计上是否有显着差异。

yit=dtβ1+Treatediβ2+Treatedidtβ3+bigidtβ4+bigiTreatediβ5+Treatedidtbigiβ6+ϵ
y_it =d_t* \beta1+Treated_i* \beta2+Treated_i *d_t *\beta3+big_i*d_t*\beta4+big_i *Treated_i*\beta5+Treated_i*d_t* big_i公司是小公司还是大公司。“d”是治疗时刻的指标,而治疗是治疗组中的假人。该函数将包括一些控制变量,以确保残差的趋势相似。

这是我正在考虑使用的公式。还是我只需要将实际治疗效果与交互项(而不是治疗时刻和治疗组假人)进行交互?此外,我认为这将满足 DiD 估计器的假设是否正确?预处理期的趋势将是相同的,取决于是大公司还是小公司,这由该设置捕获。治疗是外源性休克。

如果这不是一种有效的方法,那么合适的替代方法是什么?我想为小样本和大样本分别运行 DiD,但这并不能告诉我哪个组面临更大的影响。至少不能以我可以统计测试哪个更强的方式。

2个回答

三重差分是这个问题的正确规范。我将给出一个概念解释,然后是一个数学解释。

从概念上讲,标准(双重)差异中的差异也可以被认为是估计异质治疗效果。从这个角度来看,time是“治疗”,我们想估计time两组之间对结果的不同影响。(当然,time它本身不会引起任何事情。它只是两个时间段之间发生的真实治疗的替身)。

因此,如果我们想添加另一层异质处理效果(即您的案例中大公司与小公司之间的异质性),我们可以将标准 D-in-D 扩展到三重 D-in-D。

从数学上讲,规范如下:

Y=α+β1T+β2G+β3B+γ1TG+γ2GB+γ3TB+δ1TGB

T=treatment timeG=treatment groupB=big firms

小公司治疗效果的 DD 估计为(与标准 DD 完全相同)γ1

大公司治疗效果的 DD 估计为γ1+δ1

因此,大公司和小公司的处理效果相差,这也是三重交互项或 DDD 估计的系数。(γ1+δ1)γ1=δ1

我认为这(探索 DD 对不同群体的异质治疗效果)很容易与 DDD 方法混淆。但是,它们共享相同的规范,我只需运行以下命令: yit=α+β1dt+β2Treati+β3dt×Treati+β4bigi+β5bigi×Treati+β6bigi×dt+δ0dt×Treati×bigi+ϵit

在哪里δ0 是你想要的。

δ0=[(y¯Treat,2y¯Treat,1)(y¯Control,2y¯Control,1)]big[(y¯Treat,2y¯Treat,1)(y¯Control,2y¯Control,1)]small