了解层次聚类特征的重要性

数据挖掘 Python scikit-学习 聚类 可解释的ai 凝聚的
2022-02-25 22:56:31

我用 scikit 做了一个层次聚类:

selected_model = AgglomerativeClustering(n_clusters=8)
hierarchical_clustering8 = selected_model.fit_predict(answers)

这个分类是基于 50 个特征完成的,并把我带到了 8 个集群。

我如何才能确定此分类中每个特征的重要性?

我的目标是确定每个集群最重要和最不重要的特征,并能够解释每个集群。

1个回答

因为你有一个经过培训和准备好的估算器。您可以使用创建的类并基于这些类训练分类模式。我会尝试一个具有内置特征重要性属性的随机森林分类器。该属性表示特征强加的信息增益。