我是第一次进行 PCA 分析,难以解释结果。这是我的双图(由 Matlab 的函数pca和生成biplot,红点是 PC 分数,蓝线对应于特征向量;数据未标准化;前两台 PC 占我原始数据集总方差的约 98%):

我个人的解释是(如果我理解正确的话)所有变量(b1 到 b7)在 PC1 轴上都有正值,而 b5 和 b7 在 PC2 中是正值,而 b1 到 b4 是负值。
由于 PC1 中的所有变量都是正的,因此对系统约束最大的变量是 b5 和(然后)b7 和 b4(在 PC1 轴上)。
在 PC2 轴上,这两组变量对系统有相反的影响(由我猜测它的内在含义是什么)。
说到分数,他们聚集的很好,所以我认为他们对系统的反应都很一致,除了一些局外人。
我的问题:
- 蓝色矢量方向和分数位置之间是否存在联系?意思是,结束接近某些分数的变量向量是否与这些相同的分数有关?
- 如果数据被很好地聚类,我如何根据哪个变量对系统有主要(或次要)影响来解释 PCA 的结果?