我知道作为一个问题,它可能看起来很愚蠢,但如果它使用 k = 1 的 K NN 并且我有两个相同距离的邻居,那么执行分类的最佳方法是什么?
1 - 最近的邻居,处理相同的距离
数据挖掘
机器学习
监督学习
2022-03-07 22:12:29
1个回答
最好的方法实际上取决于您的应用程序以及您的重要性。
但是,您可以尝试的事情包括:
- 增加 K 直到不再有平局 - 如果增加到 2,您可能会有另一个平局,因为它们已经处于相同的距离。因此,3 或更高应该可以解决问题。
- 为您的分类器添加另一个功能 - 如果这两个数据点的值不同,则向您的空间添加另一个维度可以解决问题。
- 选择另一个距离度量 - 你可以有一个首选的测量距离的方法,但是对于平局,选择另一个会破坏它的度量。
- 建立打破关系的规则,例如
- 选择具有最多观察数据点的类
- 随机分配一个班级
有关您的应用程序的更多信息将有助于选择最佳方法。