完整的链路聚类

数据挖掘 机器学习 聚类 算法 分层数据格式
2022-03-08 19:49:01

我猜想通过完全链接聚类来自同一集群的两个元素将始终彼此更接近来自另一个集群的其他元素。

更正式地说:

是一个聚类。 st其中 ,CzCj(x,z)<△(x,y)x,yCiCiCjCi,CjC

我还不能证明这个猜想,所以我想知道我是对还是错。如果确实如此,我将非常感谢草图证明。我很确定我可以从那里开始工作。

在旁注中(不是我认为它有区别),我将在一维数据集上应用聚类算法。

非常感谢您的意见。

2个回答

完全连锁聚类倾向于找到具有相等直径的紧凑簇。它将组间距离定义为两个簇之间对象的最大距离。此外,它可能会产生具有相同数量的对象并且对象之间的距离是连续的集群。 两个簇中对象的最大距离

所以,我可以说你的猜想是正确的。我等不及任何专家详细解释这一点。

我可能遗漏了维基百科定义中的某些内容,但集合 {1,2,4,5,7,8} 与反例?在第 4 步之后,有两个集群 {{1,2}, {4,5}}, {7,8} 和 x=5, y=1, z=7 似乎违反了您的要求。Δ(x,y)=|xy|