对简单几何图形进行分类的深度学习性能

数据挖掘 深度学习 图像分类
2022-03-07 21:38:23

我正在尝试查找有关简单几何形状分类的论文或性能数据,例如前六个凸正多边形。输入数据是计算机图形生成的,可生成各种比例和方向的凸正多边形的高对比度、清晰图像。每个图像一个多边形。除了合理的 CPU 时间外,使用的训练图像数量没有限制。还对随机生成的 CG 图像进行了测试。

正多边形只是一个例子。您可以添加圆形、椭圆、非常规多边形等。基本上任何简单的几何形状,一个称职的小学生都可以轻松地以 100% 的准确率对其进行分类。

2个回答

CNN 网络在这项任务上应该很容易达到接近 100% 的准确率。几个方面使这项任务更容易:

  1. 清洁程序生成的高对比度图像
  2. 每张图片只有 1 个形状
  3. 给定几个形状的图像,库可以通过旋转/缩放/翻转等各种变换自动生成数千个训练样本
  4. 在几层内,网络应该识别顶点的边缘检测模式并学习 3 个顶点 = 三角形等

例如,此代码可以基于少量输入图像生成训练示例:

https://keras.io/preprocessing/image/

datagen = ImageDataGenerator(
    featurewise_center=True,
    featurewise_std_normalization=True,
    rotation_range=20,
    width_shift_range=0.2,
    height_shift_range=0.2,
    horizontal_flip=True)

几篇文章:

https://www.researchgate.net/publication/312328148_Binary_shape_classification_using_Convolutional_Neural_Networks

https://towardsdatascience.com/object-detection-with-neural-networks-a4e2c46b4491

对于此任务,首先您需要从图形对象中提取一些特征,然后在该特征上运行学习算法。这个任务有很多 pf 工作。您可以在此处找到这些作品的一般视图(以及页面末尾的一些论文)。

此外,这篇文章(用于高速拐角检测的机器学习)可能对您的特定任务有用(因为您对性能有顾虑)。