我用 scikit 做了一个层次聚类:
selected_model = AgglomerativeClustering(n_clusters=8)
hierarchical_clustering8 = selected_model.fit_predict(answers)
这个分类是基于 50 个特征完成的,并把我带到了 8 个集群。
我如何才能确定此分类中每个特征的重要性?
我的目标是确定每个集群最重要和最不重要的特征,并能够解释每个集群。
我用 scikit 做了一个层次聚类:
selected_model = AgglomerativeClustering(n_clusters=8)
hierarchical_clustering8 = selected_model.fit_predict(answers)
这个分类是基于 50 个特征完成的,并把我带到了 8 个集群。
我如何才能确定此分类中每个特征的重要性?
我的目标是确定每个集群最重要和最不重要的特征,并能够解释每个集群。
因为你有一个经过培训和准备好的估算器。您可以使用创建的类并基于这些类训练分类模式。我会尝试一个具有内置特征重要性属性的随机森林分类器。该属性表示特征强加的信息增益。