我正在研究 k-最近邻算法,我正在阅读的书提到记录根据它们的平方反比加权以执行加权投票。
所以我想知道“平方反比”是什么意思,书中的例子是:
那么平方反比是否只是意味着将一个特定记录的距离潜水?任何进一步了解这可能意味着什么将不胜感激。
我正在研究 k-最近邻算法,我正在阅读的书提到记录根据它们的平方反比加权以执行加权投票。
所以我想知道“平方反比”是什么意思,书中的例子是:
那么平方反比是否只是意味着将一个特定记录的距离潜水?任何进一步了解这可能意味着什么将不胜感激。
想象一下,我们要分类为red或blue数据云中的未知灰点。您的算法设置为测量到最近邻居的欧几里得距离:
其中两个是蓝色的,第三个是红色的。即使为三个点中的每一个分配统一的权重(平等投票),该算法也正确地将未知的灰球分类为blue。但是,我们开始想知道为什么我们给第三个球(red与灰色球周围的“影响范围”相切的球)给予平等的投票权。它对分类的影响与第一个和第二个更接近球一样多,这并不完全公平。
因此,我们通过欧几里得距离平方的倒数对投票进行加权,以避免可能导致虚假分类的情况:
在这种情况下,两个邻居错误地指向一个red分配,并赢得了最终投票,从而推翻了更近的蓝色邻居的影响,这种影响可以通过平方距离的倒数加权来考虑,这样最远的- 客场red球在分类中发言权最少:
在计算上,该算法将尝试使用以下公式解决每种情况:
代表类的数量(在本例中为 , { , }),是指示变量:获得每个类的总和。最后,通过核函数计算的权重,在您描述的情况下,可能是反演核redblue