支持向量机边际项,范数还是范数平方?

数据挖掘 分类 支持向量机 正则化
2022-02-26 11:00:17

λ||w^||2+(1/n)max(0,1yi(w^x^ib))

我们知道2/||w^||是边距的宽度。

第二项惩罚一个错误分类的点,因为它与边缘的距离相对于边缘的宽度。例如,假设有一个错误分类的点x0

1y0(w^x^0b)=3
这意味着x03/||w^||远离1yi(w^x^ib)=0并受到处罚3.

第一项惩罚的是边距平方宽度的倒数。我发现很难与第二个术语调和 - 它们似乎具有不同的规模。有什么理由(直观地)为什么||w^||2被使用而不是仅仅||w^||?

PS:也许一个原因是 ||w^||2计算更容易(二次规划)?或者也许范数平方假设样本噪声是高斯的?我不确定。有没有人见过使用||w^||代替||w^||2?

1个回答

它确实是为了计算的易处理性。你不会失去最重要的稀疏性,因为这是第二项提供的。SVM 的原始公式,您可以在 Wikipedia 上找到它实际上使用w

最小化服从wyi(wxib)1ξi

显然,最小化相同。使用拉格朗日函数引入约束时会出现数量上的差异,但质量上是相同的。ww2