当有很多变量时如何查看相关图?

数据挖掘 相关性
2022-02-22 14:02:23

我的变量有超过 4000
我的 corr() 图看起来像这样

在此处输入图像描述

有没有更好的方法可以更清楚地查看此图?

1个回答

您正在尝试一次查看约 800 万个系数,恐怕没有一种技术可以真正帮助您。

但是,您可能想要调查您的相关结构。第一步是做一些基于相关性的聚类。在 Python 中,您可能想要绘制您的树状图:https ://docs.scipy.org/doc/scipy/reference/generated/scipy.cluster.hierarchy.dendrogram.html这将允许您观察相关的子集群。进一步的调查将取决于您要达到的目标。