编辑答案部分指出我混淆了k-means和kNN。事实上,我在考虑 kNN,但写了 k-means,因为我对这个话题还是新手并且经常混淆这些术语。所以这是改变的问题。
我今天在看 kNN,有些事情让我觉得很奇怪,或者 - 更准确地说 - 我无法找到关于以下情况的信息。
想象一下,我们为某个数据集选择 kNN。我想尽可能保持一般性,因此此处不详述。此外,我们在某个点上选择一个观察值,其中满足在邻域中的要求的邻居数量实际上比指定的要多.
如果我们被限制使用特定的 K 并且因此不能改变邻域的结构(邻域的数量),那么这里应该应用什么标准/标准。哪些观察将被忽略,为什么?这也是经常发生的问题,还是异常?