零膨胀泊松回归 Vuong 检验:原始、AIC 或 BIC 校正结果

机器算法验证 拟合优度 aic 零通胀 比克
2022-03-19 10:48:41

我正在分析一组十个物种的计数数据,发现对于检测率最高的五个物种,零膨胀泊松 (ZIP) 回归对数据的拟合效果明显优于在 R 中使用 glm 的常规泊松回归。我发现这使用 vuong 测试来比较两个模型,使用以下代码(ZP = 区域/阶段组合,因为数据分为前/后阶段、控制/影响区域)

summary(m2 <- zeroinfl(Squirrel ~ ZP|ZP, data = bact))
summary(p2 <- glm(Squirrel ~ ZP, family = poisson, data = bact))
vuong(p2, m2)   

然而,对于接下来的五个物种,vuong 检验显示 ZIP 回归和 glm 泊松回归的拟合结果有些矛盾。我想知道原始的、AIC 校正的 BIC 校正的 p 值之间的区别是什么,以及我最应该关注的是哪个(即我应该关注哪个 p 值)。例如,第六大常见物种的 vuong 结果如下所示:

Vuong Non-Nested Hypothesis Test-Statistic: 
(test-statistic is asymptotically distributed N(0,1) under the
null that the models are indistinguishible)
-------------------------------------------------------------
              Vuong z-statistic             H_A    p-value
Raw                  -0.3378267 model2 > model1    0.36775
AIC-corrected         4.5566296 model1 > model2  2.599e-06
BIC-corrected        19.4932729 model1 > model2 < 2.22e-16

如果我使用原始结果,我会得出结论,ZIP 模型并不比 glm poisson 模型好。但是,使用 AIC 或 BIC 校正的结果,我会得出结论,ZIP 模型比 glm 泊松模型更好。

这三个值有什么区别,我应该如何决定使用哪个作为结果?谢谢!

3个回答

我确信使用任何形式的 Vuong 测试作为零通胀测试都是不正确的。我发表了一篇论文“The misuse of the Vuong test for non-nested models to test for zero-inflation”,解释了原因。请参阅http://cybermetrics.wlv.ac.uk/paperdata/misusevuong.pdf我还在主要的统计会议上发表了这篇论文,没有人不同意我的观点。

如果您仍在为此努力,或者总体上是零通货膨胀,如果您愿意,请与我们联系。

很好的问题,有一个非常不好的答案:这取决于。

这取决于 DGP 中是否真的存在零通胀。换句话说,vuong 测试是有条件的 - 不是诊断,因此当涉及到您的结果时,会有很多理由证明。

我发现最好的解释是在 Desmarais 和 Harden (2013)。

首先,这些是什么:1)我假设您知道 Vuong 检验统计量(原始)是什么,以及它是如何估计的。2) AIC 和 BIC 统计是对数似然估计的修正,因为标准(原始)统计是有偏差的。

那么哪个最好呢?他们这样说(非常基本):1)如果 DGP 不是零膨胀,那么 BIC 校正将表现最好,其次是 AIC 校正,然后是原始统计。

2) 如果 DGP 是零膨胀的,那么三个测试中的每一个都表现得类似。

附加:1) 根据 Desmarais 和 Harden 的说法,这仅适用于 Poisson 模型,并且在查看 NB 模型时,这些校正的表现不同。2) BIC 校正失败或成功的部分原因是由于观测的数量和(更重要的是)膨胀方程中包含的协变量的数量(和准确性)。

换句话说,您可能需要对样本的 DGP 做出一些假设,然后根据不同的模型规格选择合适的方法。

很简单,对吧?

这是我也在寻找的一个非常有趣的问题。不幸的是,我还没有找到答案。这就是为什么我无法帮助您解释 Raw、AIC 和 BIC 之间的区别。

但是,我可以帮助您解决最初的问题,即您应该选择哪种型号。

AIC 和 BIC 校正测试基于检查模型 1 > 模型 2,而原始测试模型 2 > 模型 1。因此,在您的情况下,泊松回归应该非常适合。