残差与。带有异常值的拟合图

机器算法验证 r 回归 多重回归 线性模型 残差
2022-03-20 04:51:06

我有一个将油耗与其他车辆参数相关联的模型,它产生以下残差 Vs。拟合情节。

在此处输入图像描述

我的问题:向右偏斜是否只是数据中异常值的指示?如果是这样,基于该图假设模型的线性是否安全?

附加信息:我已经使用 R crPlots 包分别绘制了因子,如下所示:

在此处输入图像描述

1个回答

由于两个原因,拟合值可能会异常:

  • 预测变量值异常
  • 与其他预测变量相比,预测变量值非常正常,但是由于极端误差项,结果是异常的。

在这种情况下,我会研究 Cooks 距离。如果它显示异常结果变量是由具有高 Cooks 距离的预测变量组合引起的,您可能会怀疑存在问题。

鉴于四个预测图,我怀疑异常结果是由于因子 1 与因子 3 的极端值(这也会导致高库克斯距离),因此您可能会质疑您的线性模型是否仍然适用地区。

希望这会有所帮助,并且我没有说任何愚蠢的话。