数据挖掘 - knn 和这个版本的 k-means 类似吗？ - 吾爱随笔录

数据挖掘聚类线性回归 k-均值

2022-03-03 05:03:08

如果我们在数据集中使用 k-means，其中 k 等于数据集中的点数，并且每个集群仅由一个点组成。考虑到我们已经给出了一个距离方法，我们可以对一个测试实例进行分类，将其与质心最接近给定点的集群相关联。质心在测试阶段没有变化。

上述策略与什么自动分类方法相似？

是的，这是一个家庭作业。我的答案是 knn，这是正确的吗？但我不知道如何正确地争论这一点。

1个回答

您的情况是K=dataset 中的点数：

K-means：假设有 10 个数据点，k=10，所以你有 10 个聚类。新的测试点将与离它最近的集群匹配
KNN：如果 K=1，那么新的测试点分类将与 K-means 中的相同。

所以，如果每个集群有一个数据点，那么你给出的答案就是。如果我们取 k=1，knn 在技术上是正确的。

其它你可能感兴趣的问题