我正在使用 r 在我的数据集上运行 PCA,并且需要一些帮助来解释标准偏差结果。
这是结果
> summary(wine1.pca)
Importance of components:
PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 PC9 PC10 PC11 PC12
Standard deviation 1.7440 1.6278 1.2812 1.03373 0.91682 0.81266 0.75088 0.7183 0.67710 0.54683 0.47704 0.18111
Proportion of Variance 0.2535 0.2208 0.1368 0.08905 0.07005 0.05503 0.04698 0.0430 0.03821 0.02492 0.01896 0.00273
Cumulative Proportion 0.2535 0.4743 0.6111 0.70011 0.77016 0.82520 0.87218 0.9152 0.95338 0.97830 0.99727 1.00000
从我所读到的内容中,最好选择能够解释 85% 或更多变化的组件数量。
问题
执行 PCA 时,类变量是否应该是数据帧的一部分?
我如何从这些结果中找出有多少分量会产生 85% 或更大的方差?是不是
PC5因为标准差是 0.91,然后下降PC6到 0.81?
