kNN(分类器) - 缺点

数据挖掘 分类 数据挖掘
2022-03-06 18:44:10

所以我最近来到了 kNN k 最近的邻居。在查看它的缺点时,大多数文献都提到它昂贵、懒惰、需要完整的训练数据加上取决于 k 的值,并且由于距离而存在维度问题。除此之外,我有以下假设。

1-它忽略了维度可以相互关联的事实,而是假设它们是独立的(因为我们只是在计算距离) 2-存在数据标准化的问题......如果数据未标准化,距离可能会偏向具体维度

除了上面提到的那些之外,我想对kNN的缺点进行全面分析,如果它们错了,那是为什么。

1个回答
  1. 它不能很好地处理分类变量
  2. 它不处理“软”边界——即某些情况出现在边界两侧的区域。另请参阅此处的 mathbabe:https ://mathbabe.org/?s=nearest+neighbor - 以获取更多批评。