深度训练中的数据增强

数据挖掘 深度学习 分类 训练 准确性 数据增强
2022-02-27 13:59:02

我试图了解数据增强的作用以及它如何影响深度模型的性能/准确性。我的目标应用程序是火灾分类(火灾与否,在视频帧上),有近 15K 的正样本和负样本,我使用了以下数据增强技术。使用以下所有内容是否总能提高性能?或者我们必须根据我们的目标应用程序以某种方式巧妙地选择它们?

rotation_range=20, width_shift_range=0.2, height_shift_range=0.2,zoom_range=0.2, horizontal_flip=True

当我想得更多时,火总是直接向上的,所以我认为rotation或者shift实际上可能会使结果恶化,因为它会使图像两侧像这样拉伸,这与视频帧中的火无关。与旋转相同。所以我想也许我应该只保留zoom_range=0.2, horizontal_flip=True和删除前三个。因为当我们在视频中使用场景过渡效果时,我看到了一些误报。

我的论点正确吗?我应该保留它们还是删除它们?

在此处输入图像描述

在此处输入图像描述

1个回答

你的推理完全正确。增强只是一个过程,它可以帮助您更好地覆盖您的领域。您应该只选择对您有帮助的运营商。滥用增强肯定会弄乱你的模型。在这些限制下打印数据以检查自己总是一个好主意。也试着想想,如何在生产中获取数据。Albumentations是一个不错的 repo,有很多可用的方法。