使用 lmer 在混合模型中进行计划比较

机器算法验证 混合模式 相互作用 模型比较
2022-04-06 22:12:18

在解构我的混合效应模型时,我发现了一个三向显着的交互作用。我通过使用最大似然比检验计算了我的 p 值,从而允许比较两个模型的拟合(具有所有预测变量的模型减去具有所有预测变量但感兴趣的预测变量的模型 - 在这种情况下,三向交互)。当我对三向交互进行后续比较时,是否需要使用 Bonferroni 校正来校正 alpha 显着性水平?

感谢所有输入!

编辑:(合并自答案--mbq)

我想看看三向交互的重要性,然后……我想看看第一个三向交互中的任何其他重要交互。

如何?我希望这更清楚?

谢谢!

基本上,我想检查我的三向交互的“方向”,并测试该交互中的差异是否显着。

1个回答

听起来你基本上有模型选择的问题。我认为这最好作为一个决策问题来对待。你想表现得好像你选择的最终模型是真正的模型,这样你就可以对你的数据做出结论。

因此,在决策理论中,您需要指定一个损失函数,它说明您将如何对每个模型进行排名,以及您将在其中做出决定的一组替代模型。有关推理中假设检验的决策理论方法,请参见此处此处是一个使用决策理论方法来选择模型的方法

听起来您想使用p 值作为损失函数(因为这就是您想要比较模型的方式)。因此,如果这是您的标准,那么您选择 p 值最小的模型。

但是该标准需要适用于模型的共同点,即基于统计数据的“明显”选择,该统计数据衡量模型与数据的拟合程度。

一个例子是用于预测一组新的观测值的平方误差总和,这些观测值不包括在模型拟合中(基于“好的”模型应该重现它应该描述的数据的想法)。因此,对于每个模型,您可以做的是:

1)将您的数据随机分成两部分,一个足够大的“模型部分”用于您的模型,一个“测试”部分用于检查预测(如果模型是一个好的模型,哪个特定的分区应该无关紧要)。“模型”集通常比“测试”集大(至少大 10 倍,具体取决于您拥有多少数据)

2)将模型拟合到“模型数据”,然后用它来预测“测试”数据。

3) 计算“测试”数据中预测的误差平方和。

4)根据您对数据的需要重复 1-3 次(以防万一您进行了“坏”或“不幸”分区),并取步骤 3 中误差平方和的平均值)。

似乎您已经定义了一类您愿意考虑的替代模型。

附带说明:您用于选择模型的任何程序都应进入步骤 1,包括“自动”模型选择程序。这样,您就可以正确解释自动过程所做的“多重比较”。不幸的是,您需要另一种选择(也许一种是“向前选择”,一种是“向前逐步”,一种是“向后选择”,等等)。为了“保持公平”,您可以为所有模型保留相同的分区集。