我的数据行为不端,尽管进行了比 Optimus Prime 更多的转换,但我似乎无法获得具有恒定方差的残差。是否可以继续进行分析并记下由于数据难以或不可能与线性模型拟合而违反了某些假设?

我的数据行为不端,尽管进行了比 Optimus Prime 更多的转换,但我似乎无法获得具有恒定方差的残差。是否可以继续进行分析并记下由于数据难以或不可能与线性模型拟合而违反了某些假设?

这些残差的分布在我看来还不错。有了 x 的这种排列,您期望价差应该是什么样子?(我更担心转换会使您的平均函数在 x 中非线性。)
具体来说,如果我生成具有类似 x 模式且 y 具有恒定方差的随机数据,则残差图通常看起来像这样。请注意,您对传播的印象在很大程度上受到每个 x 处的残差范围的影响,即使在 sd 恒定的情况下,随着 x 密度变薄,残差范围也会平均缩小。
这是四个残差图示例,其中数据是随机生成的——每个 x 处的人口分布是恒定的(我知道,因为我以这种方式生成了数据)。如您所见,这些图的外观与您的大致相似,看起来像模糊的椭圆点云(有点让人联想到Stewie Griffin 的头部形状)。
当 x 模糊正常时,残差图应该是这样的。因此,如果这是您的反对意见,那不仅不是问题,而是您希望看到的。

现在让我们假设我们有实际异方差的明确证据。我们可以忽略它吗?
嗯,这取决于。您对标准偏差的估计(例如回归系数)将有偏差。您在测试中的 p 值将是错误的。置信区间会出现偏差,预测区间在某些地方太窄而在其他地方太宽。
如果您不做任何这些事情,那可能就没那么重要了;估计系数的一些低效率可能是最糟糕的。