为什么只考虑 1 个随机截距参数的 k-1 截距是有效的?

机器算法验证 随机效应模型 固定效应模型 自由程度
2022-04-03 05:52:14

我对随机效应与固定效应以及如何在 SAS 中编写随机效应模型有基本的了解。但是,我很难理解随机效应项的推导,例如,随机截距模型如何描述k使用单个参数截取 (σ2对于普通的数据库)而不是k1参数,这可以大大节省自由度。这不是作弊吗?;)

老派技术是使用最大似然法来解决k1每个类别的参数。

  • 随机截距模型如何通过使用单个参数来避免这种情况?
  • 最终结果不一样吗——随机效应模型和固定效应模型都会估计k1拦截条款?
2个回答

混合效果模型的情况会稍微复杂一些(正如您所意识到的那样)。

来自正态模型的估计随机效应与计算每个单独截距时计算的固定效应并不完全相同。固定效应模型假设所有组具有相同的方差,但每个组都有自己的均值,并且均值彼此独立计算(基本上是每组的均值/截距)。在混合效应模型中,随机截距来自正态分布的假设允许方法在计算每个截距时从所有组中“借用”信息,因此各个截距趋向于向整体均值“缩小”,这样的效果是通常被称为“回归均值”。

估计的随机效应不是真正的参数,而是随机变量的估计,因此它们不会花费相同数量的自由度。但是你担心应该只有 1 个自由度的成本是正确的,真正的成本可能介于1k1. 是一篇提供更多细节和额外参考的帖子。

当然,讨论自由度假设比率遵循 F 分布,这在混合效应模型中本身就是有问题的。

正如我研究了随机与固定效果一样,我也无法在不丢失 df 的情况下得到你“估计”参数的东西。但如前所述,最大的区别在于,RE 的估计并不是经典 OLS 意义上的估计。据我了解,最好将其称为“预测”,因为我们估计的是随机变量的结果,而不是给定宇宙的固定参数的结果。

如果您可以阅读德语内容,如果您愿意,我可以向您推荐一本书。