我们有 4000 个特征,我们正在应用主成分分析将它们的少量特征从 20 个减少到 100 个。
我们正在执行线性回归。
训练和验证错误都比不使用 PCA 更糟糕。
然而,我们注意到训练误差并没有降低,实际上已经变得比验证误差略大。
这是预期的吗?
编辑:
与其他主成分相比,第一主成分的方差比足够高。
我们注意到的是,如果您使用所有 4000 个主成分,那么训练误差和验证之间的差距会更大,并且当您重复该过程并将主成分减少到 1000、200、100、10 等时,那么训练错误更接近验证错误(即使两者都按预期增加)