我正在尝试训练一个分类器(比如说对一个对象 X 或不是 X 进行分类)。但是我没有太多想要分类的对象 X 的真实图像。因此,我使用一些照片编辑工具制作了自己的一些合成图像,但问题是在输入合成数据后,我的分类器无法识别真实对象。而且由于我有 2-3 张真实物体的图像,所以我无法提供更多真实数据。有没有关于如何用合成数据来识别真实数据的解决方案?
在合成图像上训练分类器以识别真实图像
数据挖掘
图像分类
2022-03-02 20:26:47
2个回答
正如 Paul 正确指出的那样,有几种可用的数据增强技术。例如,您可以查看以下https://www.kaggle.com/cdeotte/25-million-images-0-99757-mnist,其中 2500 万张图像是从 42K 原始图像生成的。
我想补充的唯一其他方法是,如果您要分类的真实图像可以分解为更小的特征。例如,假设您想对一个骑自行车的人的图片进行分类,他的手臂上挂着一个包。你可能没有太多的图片,但你有数百万的自行车、男人和包的图片。您可以在这些基础上进行训练,并在模型中按原样重复使用一些较低层。
神经网络需要大量数据进行训练。这是他们最大的缺点之一,很难解决这个问题。
使用人工数据不是解决方案。我们并不真正了解网络正在学习什么,我们无法判断它是否学到了合成图像特有的任何东西。
您可以做的是使用某种数据增强。多次旋转、缩放、翻译图像,并创建更大的数据集。
由于它是一个很小的数据集,如果确实无法获得更多的数据,您应该考虑其他方法来帮助分类。要么手动设计一些特征来帮助分类器,要么用更传统的方法进行分类。
其它你可能感兴趣的问题