分离数字风格以进行简单数字分类

数据挖掘 美国有线电视新闻网 图像分类 极简主义
2022-02-26 00:17:27

我刚刚开始使用我的第一个简单的数字分类器,所以我的怀疑程度很低。到目前为止,在我见过的每个数字图像数据集中,每个数字的不同变体都被分组在一起,例如:

在此处输入图像描述 在此处输入图像描述 在此处输入图像描述

所有这些图像都代表数字 1,但外观差异很大。在这种情况下,简单的卷积神经网络不会很难学习 1 的视觉模式吗?特别是考虑到第三张图片在设计上与 7 的相似之处。

我的问题是:创建“1”、“1-alt”、“1-serif”等其他标签会更好吗?然后 CNN 可以将图像作为 1 的变体的概率相加,然后给出它的预测,但我不确定这一点。
专业分类器如何解决这个问题?
从理论上讲,这种方法会以任何方式影响性能或准确性吗?

1个回答

有趣的问题。您假设某些 1 可能与 7 混淆是正确的,例如与 8 和 3 相同。

通常不会按照您的建议创建不同的类,仅仅是因为它需要更多注释。

有多种方法可以处理这个问题。

  • 堆叠模型

任何标记为 1 或 7 的东西都将提供给经过微调以区分这两个特定数字的模型

  • 加权训练

可以教你的模型一些错误比其他错误更严重。在您的情况下,7 的 1 是不好的,因此您可能会增加犯该错误的成本。