从绝对距离边缘图中提取聚类

计算科学 机器学习 统计数据 矩阵 数据分析
2021-11-28 13:09:22

我不知道我是否正确地制定了这个问题:

我有很多物品以及每对物品之间的距离。将这些数据输入到一些可视化工具中,我能够创建一个具有任意定义坐标中心的漂亮网络图像。(因为我只有距离,这并不意味着任何坐标)我可以观察图中的一些集群。

现在我想以高度的信心证明存在一些有效的项目分类。

我们不要问集群的数量是从哪里来的。最坏的情况是我必须在合理的时间间隔内详尽地搜索它。

我有矩阵形式的距离,其中(行,列)=(i,j)条目是从点 i 到点 j 的距离。距离按最大值归一化,因此它们的范围是 0 到 1。

有没有一种好方法可以从中提取集群?

1个回答

您可以从使用简单的k-means 聚类算法开始。在这种方法中,您的目标是选择一组k方法mi, 并分配每个点x在你的数据到某个集合Si; 在每组中,您希望最小化平均距离:

i=1kxSi|xmi|2=最低限度。

给定一组手段的一些猜测{mi}i=1k,通过计算均值的Voronoi图可以找到最接近每个均值的数据点然后迭代地更新均值。

k-means 对于您的目的可能已经足够了,但是如果您尝试它并发现它不够,那么还有很多其他算法可以解决这个问题。这些都是启发式的,而不是为您提供确切的解决方案,因为对于任何现实标准(我认为),聚类通常是 NP 完全的。