对不属于类集的数据进行分类的最佳方法是什么?

数据挖掘 机器学习 预测建模 支持向量机 多类分类
2022-02-24 11:02:47

我正在预定义类的图像数据集上构建多类支持向量机(准确地说是 8 个类)。然后我想到了一个问题:

如果我有一个不属于预定义类集的图像,结果会是什么?

所以我决定尝试一下,结果很糟糕。对于不属于任何类别的图像,我获得了更高的准确性。一些图像给出了 98% 的准确度,它们属于特定类别,尽管我的期望应该是它们应该具有非常低的准确度。

我还尝试使用 OnceClass SVM 首先预测它是否属于类。如果是,那么标签是什么?(意思是我有 2 个模型)。

但这似乎不起作用,因为 OneClass SVM 无法很好地分类“其他”图像。现在我已经没有如何去做的想法了。

我该如何解决这个问题?

2个回答

只是一个尝试的方法的建议。

阶段:使用一类 SVM 将那些不属于预定义类集的图像分配为第类。19

阶段:对于那些通过过滤器的图像,让多类 SVM 将它们分配给个类之一。28

因为,通常你无法对你拥有的 8 个预定类别之外的不同图像有什么样的概述,这听起来像是一个异常值检测问题。也许你可以使用一些自我异常检测算法。

想到的另一种方法是扰动图像并将其提供给分类器。我猜如果分类器选择随机噪声来确定一个类别,那么这可能会导致它将图像分配给不同的类别。