这里有很多类似的问题,但我还没有找到这个特定问题的答案。
资料来源:例如在https://peopleanalytics-regression-book.org/linear-reg-ols.html#norm-dist-assum中,作者(一位数学家)说:
在适当的模型中,我们期望我们的误差是随机的,因此我们期望我们的残差正态分布在足够数量的观察中。
然后作者继续申请qqnorm(newmodel$residuals)数据进行诊断。
如果你在 R ( plot(mymodel)) 中绘制一个模型,你会得到一堆诊断图,其中第二个是针对理论分位数绘制的标准化残差 - 所以基本相同。
但为什么?残差正态分布的原因是什么,而不仅仅是随机分布,根本没有公认的分布或其他分布?统计教科书认为这很明显 - 有人可以解释一下吗?