我遇到的许多微生物组(微生物生态学)论文都使用主成分分析(PCA)或主坐标分析(PCoA)来对数据做出结论。许多这些声明是基于具有低方差的组件/坐标,或者通过使用较高的组件来显示在较低的主组件中不可见的模式。尽管我在这里发现了一些涵盖 PCA/PCoA 图解释的问题,但我还没有找到任何关于是否可以基于解释较低方差的组件做出有意义的推断的讨论。
下图来自一篇比较不同时间孕妇肠道细菌的论文。每个点代表一个细菌群落。看起来 T1 样本在图的左侧聚集在一起,但是当分量方差分别只有8.9% 和 4.5% 时,这有意义吗?

我的第二个问题是,当这些模式在较低组件中不可见时,基于较高组件中可见的模式进行推断是否有意义。
Human Microbiome coursera 课程就是一个很好的例子。下图显示了细菌群落如何从不同的身体部位聚集在一起。在此示例中,阴道群落(以紫色显示)与皮肤群落(以绿色显示)聚集在一起。

但是,当您仅查看主成分 4 到 6 时,该社区似乎会自行聚集。当您在前几个没有获得单独的集群时,继续查看其他组件是否可以接受?对我来说,这感觉就像你在寻找你想看到的结果。

我将非常感谢有关此主题的任何见解!以下是我在这里找到的并没有完全回答我的问题的相关主题:
资料来源: