机器算法验证 - K-means Mahalanobis 与欧几里得距离 - 吾爱随笔录

K-means Mahalanobis 与欧几里得距离

机器算法验证分类 k-均值距离无监督学习欧几里得

2022-03-20 05:51:10

我目前正在尝试对双时间多光谱卫星图像上的变化“类型”进行聚类。

我对两个图像都应用了一个叫做疯狂变换的东西，5000 x 5000 像素 x 5 个波段。每个波段都是一个“变量”，因为它是来自不同光谱的辐射信息。这种变换基本上相当于 PC 应用于两个图像的减法。

当然，我最多可以得到 5 个疯狂的组件。现在我想在这些组件上找到这种类型的变化。如果我在组件上使用 K-means，我会使用欧几里德距离，但我只是想知道使用马氏距离（如果有的话）会有什么好处。

1个回答

我不了解您使用的转换类型，因此我的回答将是一般性的。简短的回答是：使用马氏距离您将获得多少实际上取决于数据中自然分组（即集群）的形状。

在 k-means 中使用 Mahalanobis 与 Euclidean 距离的选择实际上是在使用集群的全协方差或忽略它们之间进行选择。当您使用欧几里得距离时，您假设集群具有恒等协方差。在 2D 中，这意味着您的集群具有圆形形状。显然，如果您的数据中自然分组的协方差不是恒等矩阵，例如在 2D 中，集群具有椭圆形协方差，那么使用 Mahalanobis over Euclidean 将是更好的建模。

您可以同时尝试两者，看看使用马氏距离是否会给您带来显着的收益。它还取决于集群后您将做什么。集群本身通常不是最终目的。您可能会在一些后续处理中使用这些集群。因此，欧几里得与马氏的选择可能取决于您后续处理的性能。

其它你可能感兴趣的问题

上一篇返回前访问所有其他州的可能性下一篇计算对数概率。高维狄利克雷分布