机器算法验证 - panel-DiD 框架中的动态治疗时机 - 吾爱随笔录

panel-DiD 框架中的动态治疗时机

机器算法验证计量经济学面板数据差异中的差异治疗效果治疗

2022-04-11 03:40:01

我有一个关于治疗效果时间的问题，以及如何在面板数据集上使用差异估计量。

首先让我说我有一个大的公司级别的不平衡面板数据集，其中 N 大（7000 左右），T 小（从 3 到 28 不等）。我对分析特定政策干预的效果很感兴趣，但是，问题在于不同公司的治疗时机不同，我想知道如何（以及是否）可以在 DiD 框架中解释这一点。

据我了解，具有同时处理的一般 DiD 面板数据设置如下所示：

y_{i t} = α_{0} + α_{1} {Treat}_{i} + α_{2} {After}_{t} + δ (Treat*After)_{i t} + x_{i t}^{'} β + FFE + TFE + ε_{i t},

$y_{it} = \alpha_0 + \alpha_1 \text{Treat}_{i} + \alpha_2 \text{After}_{t} + \delta (\text{Treat*After})_{it}+ x_{it}'\beta + \text{FFE}+\text{TFE} + \varepsilon_{it},$ 在哪里：

如果在治疗组中，Treat = 1，否则为 0
After = 1 如果在政策干预之后，否则为 0
$x$ 是控制向量， $\alpha_i$ 是参数/常数和 $\delta$ 是治疗效果
FFE 是公司固定效应，TFE 是时间固定效应

在搜索了该站点后，我无法找到我完全理解的答案，但是，据我所知，这篇文章建议按照以下方式运行模型：

y_{i t} = α_{0} + α_{1} {Treat}_{i} + δ {Policy}_{i t} + \sum_{t = 2}^{T} α_{t} {year}_{t} + x_{i t}^{'} β + FFE + ε_{i t},

$y_{it} = \alpha_0 + \alpha_1 \text{Treat}_{i} + \delta \text{Policy}_{it}+ \sum^T_{t=2} \alpha_t \text{year}_t+x_{it}'\beta + \text{FFE} + \varepsilon_{it},$ 在哪里：

“ ...policy 是每个人的虚拟变量，如果个人在政策干预/治疗后处于治疗组中，则等于 1... ”（来自上面链接的帖子）
年份是一组时间假人

我想我有两件事我不理解这种方法；

假人的构造 $\text{Policy}_{it}$ . 这个虚拟变量是否只是在每个经过处理的公司进行时变处理后取值 1？或者帖子的作者是否意味着每家公司都有一个虚拟人指示治疗时间？
我的第二个问题与第一个问题有关，但更具概念性。据我了解，差异中的差异方法是关于在没有治疗的情况下使用未治疗作为治疗的反事实结果（假设平行趋势）。然而，在这种情况下，当不同公司的治疗时间不同时，对照组没有明确的“后期”，我相信这就是我在这里混淆的原因。上一个链接中建议的这种方法背后的概念是什么？这种方法是否可行，或者应该应用一些不同的识别策略？在那种情况下，考虑到这种情况，什么是合适的？

任何答案，对使用具有不同处理时间（最好是计量经济学性质）的面板数据集的论文或书籍的参考将不胜感激。

//比利

1个回答

您按照您第一次描述它的方式构建策略虚拟对象，即创建一列零。然后对于每家公司，如果一家公司在治疗组中并且它处于治疗后阶段，则将其替换为那些公司。像这样的东西

\begin{array}{ccccc} firm & time & treated & post & policy \\ 1 & 1 & 0 & 0 & 0 \\ 1 & 2 & 0 & 0 & 0 \\ 1 & 3 & 0 & 1 & 0 \\ 1 & 4 & 0 & 1 & 0 \\ 2 & 1 & 1 & 0 & 0 \\ 2 & 2 & 1 & 0 & 0 \\ 2 & 3 & 1 & 1 & 1 \\ 2 & 4 & 1 & 1 & 1 \\ 3 & 1 & 1 & 0 & 0 \\ 3 & 2 & 1 & 0 & 0 \\ 3 & 3 & 1 & 0 & 0 \\ 3 & 4 & 1 & 1 & 1 \end{array}

$\begin{array}{ccccc} \text{firm} & \text{time} & \text{treated} & \text{post} & \text{policy} \\ \hline 1 & 1 & 0 & 0 & 0 \\ 1 & 2 & 0 & 0 & 0 \\ 1 & 3 & 0 & 1 & 0 \\ 1 & 4 & 0 & 1 & 0 \\ \hline 2 & 1 & 1 & 0 & 0 \\ 2 & 2 & 1 & 0 & 0 \\ 2 & 3 & 1 & 1 & 1 \\ 2 & 4 & 1 & 1 & 1 \\ \hline 3 & 1 & 1 & 0 & 0 \\ 3 & 2 & 1 & 0 & 0 \\ 3 & 3 & 1 & 0 & 0 \\ 3 & 4 & 1 & 1 & 1 \\ \end{array}$

在哪里 $\text{post}$ 是后期治疗期的指标。在上面的等式中， $\alpha_0$ 和 $\text{Treat}_i$ 将被公司固定效应所吸收。

关于解释，此设置做出了我在之前的答案中可能没有说明的假设。假设是所有时期的治疗效果相同。这意味着，如果一家公司昨天接受治疗并获得 2 的收益，那么今天接受治疗的公司也获得 2 的收益（相对于从未接受治疗的公司）。我做了一个图表来说明这个假设意味着什么

如果您需要参考，您可以查看 Jeff Wooldridge 关于差异差异的注释以及关于多个组和时间段的扩展部分：http ://www.nber.org/WNE/Slides7-31-07 /slides_10_diffindiffs.pdf（计量经济学有什么新变化？第 10 讲差异差异估计，Wooldridge 2007）。

其它你可能感兴趣的问题

上一篇对于非完美正态分布，置信区间是否会带来一些额外的误差？下一篇为什么我们需要使用泊松、负二项式、