knn 和这个版本的 k-means 类似吗?

数据挖掘 聚类 线性回归 k-均值
2022-03-03 05:03:08

如果我们在数据集中使用 k-means,其中 k 等于数据集中的点数,并且每个集群仅由一个点组成。考虑到我们已经给出了一个距离方法,我们可以对一个测试实例进行分类,将其与质心最接近给定点的集群相关联。质心在测试阶段没有变化。

上述策略与什么自动分类方法相似?

是的,这是一个家庭作业。我的答案是 knn,这是正确的吗?但我不知道如何正确地争论这一点。

1个回答

您的情况是K=dataset 中的点数:

K-means:假设有 10 个数据点,k=10,所以你有 10 个聚类。新的测试点将与离它最近的集群匹配
KNN:如果 K=1,那么新的测试点分类将与 K-means 中的相同。

所以,如果每个集群有一个数据点,那么你给出的答案就是。如果我们取 k=1,knn 在技术上是正确的。