主成分分析需要标准化还是标准化?

数据挖掘 主成分分析
2022-03-02 05:28:06

主成分分析需要标准化还是标准化?谷歌一番后,我感到困惑。pca 需要标量相同。那么我应该使用哪个。

PCA前需要做哪些技术?

pca 需要标准化吗?标准化值始终为零,标准差始终为 1。

pca 需要标准化吗?范围从零到一

或两者 ?

2个回答

我相信标准化是指在 0 和 1 之间缩放变量。标准化是指使经验分布YN(0,1). 主成分分析,以及岭回归和偏最小二乘回归等类似方法,需要在训练前进行标准化,即yi=yiμyσy,参考:统计学习的要素,Ch。3.4

PCA 的目的是找到使方差最大化的方向。如果一个变量的方差高于其他变量,我们会使 pca 分量偏向该方向。

因此,最好的办法是使所有变量的方差相同。一种方法是标准化所有变量。

标准化不会使所有变量都具有相同的方差。