如果我们在数据集中使用 k-means,其中 k 等于数据集中的点数,并且每个集群仅由一个点组成。考虑到我们已经给出了一个距离方法,我们可以对一个测试实例进行分类,将其与质心最接近给定点的集群相关联。质心在测试阶段没有变化。
上述策略与什么自动分类方法相似?
是的,这是一个家庭作业。我的答案是 knn,这是正确的吗?但我不知道如何正确地争论这一点。
如果我们在数据集中使用 k-means,其中 k 等于数据集中的点数,并且每个集群仅由一个点组成。考虑到我们已经给出了一个距离方法,我们可以对一个测试实例进行分类,将其与质心最接近给定点的集群相关联。质心在测试阶段没有变化。
上述策略与什么自动分类方法相似?
是的,这是一个家庭作业。我的答案是 knn,这是正确的吗?但我不知道如何正确地争论这一点。
您的情况是K=dataset 中的点数:
K-means:假设有 10 个数据点,k=10,所以你有 10 个聚类。新的测试点将与离它最近的集群匹配
KNN:如果 K=1,那么新的测试点分类将与 K-means 中的相同。
所以,如果每个集群有一个数据点,那么你给出的答案就是。如果我们取 k=1,knn 在技术上是正确的。