为什么 sklearn 中的所有特征选择方法都不允许指定所需的方差解释?
sklearn.decomposition.PCA 确实允许输入一个想要解释的方差百分比来代替n_components. 然而,SparsePCA 等其他方法希望用户“知道”他/她想要使用多少个 n_components。
为什么 sklearn 中的所有特征选择方法都不允许指定所需的方差解释?
sklearn.decomposition.PCA 确实允许输入一个想要解释的方差百分比来代替n_components. 然而,SparsePCA 等其他方法希望用户“知道”他/她想要使用多少个 n_components。
因为 PCA 只是特征选择方法之一,所以不要指望其他人有一个易于处理的可计算公式来提前指定新特征的最佳数量。
我建议开始阅读表示学习,以及我们所说的潜在变量的含义。
PCA 背后的理论将方差作为一个重要概念。对于其他方法,这不一定是正确的。请注意,不同的方法对于结果的质量也有不同的“品质因数”。有许多不同的方法,您可能希望 (a) 了解哪些结果和质量指标与感兴趣的方法相关,以及 (b) 熟悉其他人如何使用和解释这些质量指标。由于没有正确理解有关某些指标的解释约定(例如,多维缩放中的压力),我犯了一些大错误。社区比我们任何人都更有智慧——利用社区(并回馈社区)!