图像分类前的数据预处理

数据挖掘 机器学习 分类 决策树 特征工程 预处理
2022-02-09 06:38:06

我正在做一个机器学习项目,图像分类(形状:100 x 100)->(向量 10000),我在应用决策树算法之前做了一些预处理,我得到了 55% 的准确率我试图改变参数但准确性没有增加,有人可以建议在预处理中做些什么,例如我所做的:

  • 去噪图像:图像噪声非常大,所以我只在每张图像中保留相关信息。(效果很好)
  • 居中图像:我将所有图像的相关值翻译到左上角,以将相关信息保留在我的向量的同一部分
  • 调整图像大小:我将每个图像的大小调整为 (40,40) -> (1600 vector) 以使输入更小

谢谢

2个回答

为什么您确信问题出在预处理中?它可能位于许多其他位置,也可能是您流程中的多个步骤。

如果我是你,我会重新审视你为什么使用决策树。图像处理还有许多其他方法,在大多数情况下,神经网络远远优于决策树。

如果你只关注预处理,你应该尝试不同的技术image augmentation,包括标准化、旋转、翻转、移位和剪切等。这里有两个很好的链接:

https://machinelearningmastery.com/image-augmentation-deep-learning-keras/

https://medium.com/nanonets/how-to-use-deep-learning-when-you-have-limited-data-part-2-data-augmentation-c26971dc8ced

这些技术可以显着提高准确性。

此外,您可能会丢失一些从 100x100 转换为 40x40 的信息。尝试使用原始大小,您可能会获得更好的准确性(尽管计算量会更大)。