在线性回归模型中,模型的欠规范会导致所谓的“遗漏变量偏差”。通常,拥有一个更大的模型比一个带有遗漏变量的模型要好。
假设您的模型如下所示:
y=Xβ+u,
而真正的模型(数据生成过程,DGP)是:
y=Xβ+Zγ+u.
在这种情况下,当你解决
E(β^)=(X′X)−1X′y
你代替y与真实模型(真实y),你最终得到:
E(β^)=(X′X)−1X′(Xβ+Zγ+u),
E(β^)=β+(X′X)−1X′Zγ+E((X′X)−1X′u),
E(β^)=β+(X′X)−1X′Zγ.
如果最后一个方程的第二项不为零,β^是有偏见的。只有当X′Z=O(当两组回归量相互正交时,因此回归量没有相关性)或者如果γ=0(在这种情况下,模型没有被低估)。
检查变量是否实际添加到模型的标准选项是查看调整后的R2以及Akaike或Schwarz标准。万一调整R2添加附加变量/特征后上升,这表明添加变量是有用的。Akaike/Schwarz 更适合嵌套模型。对于这些标准,您将选择具有最低值的模型。