如何解释 silouette 系数?

数据挖掘 聚类 scikit-学习 k-均值
2022-02-17 18:04:47

我正在尝试使用sklearn.metrics.silhouette_score. 我已经为range(2,50)集群计算了它。如何解释这个?我应该选择多少个集群?

在此处输入图像描述

2个回答

他们都是坏人。一个好的剪影应该是 0.7

请尝试其他聚类算法。

剪影测量集群之间的分离和各个集群中的凝聚力。

直观地说,它是间距 B(每个点与其最近簇的所有点之间的平均距离)和内聚力 A(每个点与其簇中所有其他点之间的平均距离)之间的差除以 max(A,B)。

它是一个介于 -1 和 1 之间的值,越高越好(负值表示该点离最近的集群比离自己的集群更近,这是一个很大的问题)。