1 - 最近的邻居,处理相同的距离

数据挖掘 机器学习 监督学习
2022-03-07 22:12:29

我知道作为一个问题,它可能看起来很愚蠢,但如果它使用 k = 1 的 K NN 并且我有两个相同距离的邻居,那么执行分类的最佳方法是什么?

1个回答

最好方法实际上取决于您的应用程序以及您的重要性。

但是,您可以尝试的事情包括:

  • 增加 K 直到不再有平局 - 如果增加到 2,您可能会有另一个平局,因为它们已经处于相同的距离。因此,3 或更高应该可以解决问题。
  • 为您的分类器添加另一个功能 - 如果这两个数据点的值不同,则向您的空间添加另一个维度可以解决问题。
  • 选择另一个距离度量 - 你可以有一个首选的测量距离的方法,但是对于平局,选择另一个会破坏它的度量。
  • 建立打破关系的规则,例如
    • 选择具有最多观察数据点的类
    • 随机分配一个班级

有关您的应用程序的更多信息将有助于选择最佳方法。

其它你可能感兴趣的问题