如果我们在 KNN 模型中不指定任何距离,如何计算 n_neighbors 参数?

数据挖掘 公制 k-nn 距离
2022-03-04 02:12:51

如果我们不指定距离,如何n_neighbors计算?

2个回答

这个问题需要更具体。并且可能会出现混乱。

  • n_neighbors,是算法使用的邻近邻居的数量。
  • metric,是您定义近邻的方式,默认情况下,是欧几里得。

metric , default='minkowski' 用于树的距离度量。默认度量是 minkowski,并且 p=2 等效于标准欧几里得度量。有关可用指标的列表,请参阅 DistanceMetric 的文档。如果 metric 是“预先计算的”,则 X 被假定为一个距离矩阵,并且在拟合期间必须是平方的。X 可能是一个稀疏图,在这种情况下,只有“非零”元素可以被认为是邻居。

n_neighbors是要考虑的邻居数。该值由您在对 KNN 模型进行编程时选择和设置。你可以用不同的值来测试不同的 KNN,它被称为超参数。您可以使用 GridSearchCV 来测试它的不同值。

然后,KNN 模型将寻找n_neighbors使用所选度量(未指定时,使用欧几里得距离)计算的最接近的(新数据点),并根据n_neighbors找到的这种方式进行预测。