我正在研究具有 22 个特征的不平衡天气数据的分类(3 类)。即使在应用 PCA 和 t-SNE 之后,数据也是重叠的。迄今为止取得的最佳分类分数是使用基于树的方法。这样的 PCA 图可能是什么原因以及我可以实施哪些技术来获得超过 80% 的准确度?
我会推荐使用UMAP。这是一个优于他们两个的算法: