所以我最近来到了 kNN k 最近的邻居。在查看它的缺点时,大多数文献都提到它昂贵、懒惰、需要完整的训练数据加上取决于 k 的值,并且由于距离而存在维度问题。除此之外,我有以下假设。
1-它忽略了维度可以相互关联的事实,而是假设它们是独立的(因为我们只是在计算距离) 2-存在数据标准化的问题......如果数据未标准化,距离可能会偏向具体维度
除了上面提到的那些之外,我想对kNN的缺点进行全面分析,如果它们错了,那是为什么。
所以我最近来到了 kNN k 最近的邻居。在查看它的缺点时,大多数文献都提到它昂贵、懒惰、需要完整的训练数据加上取决于 k 的值,并且由于距离而存在维度问题。除此之外,我有以下假设。
1-它忽略了维度可以相互关联的事实,而是假设它们是独立的(因为我们只是在计算距离) 2-存在数据标准化的问题......如果数据未标准化,距离可能会偏向具体维度
除了上面提到的那些之外,我想对kNN的缺点进行全面分析,如果它们错了,那是为什么。