我试图了解数据增强的作用以及它如何影响深度模型的性能/准确性。我的目标应用程序是火灾分类(火灾与否,在视频帧上),有近 15K 的正样本和负样本,我使用了以下数据增强技术。使用以下所有内容是否总能提高性能?或者我们必须根据我们的目标应用程序以某种方式巧妙地选择它们?
rotation_range=20, width_shift_range=0.2, height_shift_range=0.2,zoom_range=0.2, horizontal_flip=True
当我想得更多时,火总是直接向上的,所以我认为rotation或者shift实际上可能会使结果恶化,因为它会使图像两侧像这样拉伸,这与视频帧中的火无关。与旋转相同。所以我想也许我应该只保留zoom_range=0.2, horizontal_flip=True和删除前三个。因为当我们在视频中使用场景过渡效果时,我看到了一些误报。
我的论点正确吗?我应该保留它们还是删除它们?

