如果我只用正例训练分类器怎么办?

机器算法验证 机器学习 分类 一类
2022-03-29 12:56:28

我很想知道如果我有足够的正面例子会发生什么,并且我用这些例子训练了一个分类器,但没有提供负面例子。由于我有兴趣找到异常值(除了正类之外的任何东西),这个模型会起作用吗?使用少量负类或未标记示例有什么必要?非常感谢使用类比进行解释。

2个回答

一个典型的分类器可能会惨遭失败。但是,您所指的问题类型称为一类分类。您可以在此处查看对一类 SVM 的详细描述或访问此 wiki 页面

从概念上讲,考虑一个简单的 2 特征线性 SVM。您正在尝试绘制一条最好地将 2 组分开的线,但只有 1 组您会在哪里画这条线?但是,您可以想象一个一类 SVM,您可以在其中画一个包含所有训练样本的圆圈。

根据定义,分类意味着区分几个类别。如果你只提供一个类,那么就没有任何东西可以分类;大多数分类库会(明智地)抛出某种错误,而那些不会显然会预测您为所有后续示例提供的唯一类。

有用于异常值检测的模型,但那是在无监督学习领域,而不是有监督的分类。