TL、DR总结:
是否有任何理论或经验基础来支持以下陈述作为一般经验法则是正确的?
“在估计混合模型时,通常与‘高阶’项相关的随机效应的估计方差/标准差(例如,双向、三向和超越交互项的随机效应)结果小于与“低阶”项相关的随机效应的估计方差/标准偏差(例如,残差方差、与分组因素的简单效应相关的方差)。
这个说法的来源是我。;)
好的,现在是更长的版本...
通常,当我坐下来开始分析一个我知道需要混合模型的新数据集时,这是我第一个适合的模型之一(在查看数据集中的观察、绘制各种事物、交叉制表的统计前戏之后)不同的因素等)是一个非常接近“最大”随机效应规范的规范,其中估计了原则上可以从数据中估计的每个随机效应。
自然地,这种近乎最大的模型会有一些计算问题(收敛误差,或古怪的方差/协方差估计等)并不少见,我必须修剪这个模型以找到一个我的数据更容易支持。美好的。
在这些情况下,我更喜欢修剪随机项的方法不是依赖显着性检验或似然比,而是仅仅识别似乎具有最小标准偏差的随机效应(这可能有点棘手当预测变量在非常不同的尺度上时,但我尝试在我的评估中考虑到这一点)并首先在迭代过程中依次删除这些术语。这个想法是我想尽可能少地改变模型的预测,同时仍然降低模型的复杂性。
在花费大量时间后,我似乎注意到了一种模式,即遵循这种方法通常会导致我首先修剪与模型的高阶项(如上定义)相关的随机效应。这并不总是正确的,有时一些高阶项解释了很多差异,但这似乎不是一般模式。与之形成鲜明对比的是,我通常发现低阶随机项——尤其是那些与分组因素的简单影响相关的项——解释了相当多的方差,并且对模型来说是相当重要的。在极端情况下,残差项通常解释接近最大的方差,尽管当然删除该项是不明智的。
这种完全非正式的观察使我形成了我在这个问题开始时所说的假设。
如果这是真的,那么它就构成了一条有用的建议,可以传递给对这种模型选择过程缺乏经验的人。但在我开始这样做之前,我想与其他更有经验的混合模型用户核实他们对这一观察结果的反应。在你看来,它或多或少是真实的?它与您将许多不同的混合模型拟合到许多不同的数据集的经验大致一致吗?您知道为什么我们实际上可能期望在很多情况下这是真的吗?或者它只是看起来像胡说八道?
一个可能的答案是,即使在我自己的情况下也不是真的,我只是在欺骗自己。当然,我愿意接受这种可能性。
另一种可能性是,在我自己的情况下可能是正确的,但这可能只是一种巧合,与我经常使用的数据集类型有关(仅供参考,是心理/社会科学中的数据集,一小部分是实验性的,但也有相当一部分非实验性的东西)。如果是这种情况,那么可能没有充分的理由期望我的观察结果在处理非常不同类型的数据的其他领域中普遍存在。尽管如此,如果有一个连贯的非巧合原因可以解释为什么这可能是真的,即使只是针对这些特定类型的数据集,我也很想听听。
当然,另一种可能性是其他人在他们自己的数据中注意到了类似的模式,并且它代表了某种一般的经验法则,人们发现在将混合模型拟合到各种不同的数据时需要牢记这一点。如果是这种情况,那么似乎必须有一些令人信服的统计理论原因来解释为什么会出现这种模式。但我真的不知道这个原因会是什么样子。
我欢迎任何人对此提出想法和意见。请注意,就我而言,对这个问题的完全合法的回答可能就像评论一样简单,比如“是的,我注意到我处理过的数据中有类似的东西,但我不知道为什么它应该是真的”或者相反,“在我处理过的数据中,我没有注意到任何类似的东西。” 当然,我也欢迎更长时间和更多参与的讨论......