不平衡面板:汇集 OLS 与 FE 与 RE - 哪种方法产生无偏且稳健的估计量?

机器算法验证 数据集 面板数据 强大的 汇集
2022-03-27 20:59:32

我正在对收益和回报之间的关系进行实证研究。

我有一个不平衡的面板N=449公司和T=36时间段。关于估计方法我很困惑:

  1. 在大多数论文中,他们考虑了企业聚类和时间问题,因此对企业进行聚类并使用 OLS 引入时间虚拟变量。

=> 那是简单的池化 OLS 吗?

  1. 如果存在实体和时间问题,我认为应该使用组内(固定效应)或至少使用组内和组间(随机效应)估计量的加权平均值。

  2. 我已经进行了一些诊断测试:a)Hausman 测试有利于固定效应 b)Breusch-Pagan 拉格朗日乘数(LM)有利于 OLS 而不是随机效应

所以出现的第一个问题是:如何检查合并 OLS 与固定效应?

此外,我的小组是不平衡的:我小组中的公司可能会破产或与其他公司合并。因此,问题出现了:如果这些模式与特殊错误相关,那么最好避免有偏见的估计量?

下一个问题是关于Stata的。我不完全理解以下回归的区别:

1) reg yx i.time, cluster(id)

2) xtreg yx i.time, fe cluster(id) dfadj

3) xtreg yx i.time, re cluster(id)

唯一的区别是使用的估计器吗?

在大多数研究中,都使用了版本 1),尽管我并没有真正获得版本 1) 优于 2) 或 3) 的优势。

在哪种情况下,池化 OLS 优于其他方法?我注意到,当使用 fe 估计器进行固定和时间固定时,SE 是最大的。

最后一个问题出现了:如果存在未观察到的影响——坚定而时间:我如何确定这些影响是永久的还是暂时的(随着时间的推移而消失)?

对我来说重要的是得到一个可靠的推理结果。

2个回答
  1. “企业集群”并不排除 OLS 的可能性。人们可以简单地调整一个表示公司的虚拟变量,并客观地将其称为“集群”。更常见的是,“按公司聚类”意味着为公司添加随机截距项。当公司数量相对于样本量较大时,这是首选方法。添加随机截距使这种类型的模型成为混合效应模型。Pooled OLS 将估计一个随机截距一个随机斜率,因此是一个更通用的模型。然而,当每家公司的观察数量很少时,估计值可能非常不稳定。

  2. 可以使用固定效应作为虚拟变量来处理时间。最好作为连续变量。样条插值虚拟变量,而不要求所有(或什至超过 1 个)公司在完全相同的时间测量结果。这可以节省您的分箱或匹配时间,并显着改进分析。如果存在与一年中时间相关的循环效应,您仍然可以为季节添加一个虚拟变量。

  3. 如果没有关于遗漏变量、方差结构或其他因素的影响的预先设定的假设,Hausman 和 Breush Pagan 检验孤立地是没有意义的。诊断测试很容易被拒绝,因为它们只是被中等到大的样本过度驱动。最好使用像变异函数这样的诊断图。

  4. 检查合并 OLS 与固定效应的一种方法是进行似然比检验。它们都是完全 ML 程序。合并 OLS 的分子自由度为nc2+p在哪里p是内生参数的数量(如公司类型、季节)和nc公司的数量,2 是每个 subOLS 中的斜率和截距项,尽管它们可能不同。

您可以通过此方法检查 FE vs POLS,

在此处输入图像描述

资料来源:朴,洪明。2011. 面板数据建模实用指南:使用 Stata 的分步分析。教程工作文件。日本国际大学国际关系研究生院