带有 4 个类的训练集和 3 个类的测试集的图像分类

数据挖掘 机器学习 神经网络 美国有线电视新闻网 图像分类
2022-03-01 15:58:56

我必须使用 CNN 进行图像分类,为此我得到了一个包含 4 个类的训练集和一个包含 3 个类的测试集。我真的很困惑,因为我不知道这是否会影响我的预测。它从来没有发生在我身上。

我该如何处理?提前致谢。

1个回答

原则上这并没有错,因为测试集中的每个实例都是单独预测的。您将有一个 4 x 3 的混淆矩阵,因为该模型可能会预测第四类的一些误报。当然,您将无法知道模型是否可以正确识别缺失类中的真实实例。

这取决于目标是什么:

  • 如果该模型旨在能够预测 4 个类别中的任何一个,那么它应该在 4 个类别上进行训练,并且最好也在 4 个类别上对其进行测试,但仅在 3 个类别上进行测试应该已经给出了很好的结果表示其性能。
  • 如果模型只需要预测 3 个类别,那么应该从训练集中删除第 4 个类别的实例,因为它们只会让事情变得更复杂。