残差与拟合分析

机器算法验证 r 回归 线性模型 残差
2022-04-19 05:38:43

我有一个模型,我从每个人那里收集了 10 个观察值,总共 25 个人,然后是 250 个观察值。

嗯,这是我对模型的总结的一部分,

> summary(m)

Call:
lm(formula = fmla, data = mydata)

Residuals:
    Min      1Q  Median      3Q     Max 
-9.3311 -3.8480 -0.3134  3.3273 13.4413 

Residual standard error: 5.246 on 216 degrees of freedom
Multiple R-squared:  0.7702,    Adjusted R-squared:  0.7351 
F-statistic: 21.94 on 33 and 216 DF,  p-value: < 2.2e-16

看这个结果可能看起来模型非常重要,但是当我绘制残差与拟合图时,我得到了这个图,

在此处输入图像描述

这表明我在情节中有一个模式。我认为这是关于每个人的 10 次观察。谁能帮我分析一下这个情节?

1个回答

请注意,在每个对角带内,拟合值每增加一个单位,残差就会减少一个单位。在我看来,给定主题的响应保持相对恒定,并且预测变量在观察之间略有变化。因此,当预测变量的变化预测平均响应(拟合值)增加一个单位并且观察到的响应保持不变时,该观察的残差减少一个单位。

因为您有来自每个主题的多个观察结果,所以您的数据显示出聚类,如果您希望保持所有观察结果不变,则应使用处理聚类数据的方法。但是,如果您的预测变量确实比您的响应更不稳定或更容易出现测量误差,您可能会考虑将平均响应回归到每个受试者的平均预测值,或一些类似的过程。