在过去的一年里,我一直在使用支持向量机来完成二进制文本分类任务。使用过 R 和 Rapidminer 等软件后,我并没有花太多时间来了解支持向量机内部的实际情况。我现在已经开始研究这个,希望能更好地理解这种分类/回归方法。
我花了很多时间寻找计算示例,因为如果我可以在 Excel 中实际设置问题,它往往会很好地增强我对概念的理解。因此,我希望通过在这里提出这个问题来获得指导,因为我无法找到任何逐步计算的示例。人们可以很容易地找到需要理解和计算解决的数学和优化问题的描述,但我一直无法找到一个逐步计算的示例。
如果论坛批准我制作这样一个示例的想法,我将进行编辑,最后制作一个漂亮而清晰的 Excel 表格和一份指南以供将来使用。
我建议我们使用Iris数据集(即使它是一个多类数据集)并尝试将Iris setosa与Iris versicolor分开。
我提供三个链接。链接一是我认为可以用作支架的 SVM 应用理论。链接二提供了一个回归示例,说明我认为我们的产品最终会是什么样子。链接三将带您进入Iris数据集。
下面我将尝试更巧妙地表述这个问题。
问题描述:
如何应用 Excel 和具有软边距的线性支持向量机技术来解决通过使用所有可用特征从Iris数据集中分离Iris setosa和Iris versicolor给出的二项式分类任务?