我最近刚开始学习机器学习,并且有一个项目,我必须开发一个用于 QR 码本地化的程序,以便可以在任何旋转角度检测和读取 QR 码。开发将在 Python 中完成。
该计划是收集不同角度和不同背景的二维码的各种图像。由此,我想创建一个数据集,用于使用神经网络进行训练然后进行测试。
我遇到的问题是我似乎无法为数据集找出正确的特征设计以及如何从图像中识别二维码以进行特征处理。我会使用真实图像还是边缘幅度图?
对此有任何帮助吗?谢谢你的时间。
我最近刚开始学习机器学习,并且有一个项目,我必须开发一个用于 QR 码本地化的程序,以便可以在任何旋转角度检测和读取 QR 码。开发将在 Python 中完成。
该计划是收集不同角度和不同背景的二维码的各种图像。由此,我想创建一个数据集,用于使用神经网络进行训练然后进行测试。
我遇到的问题是我似乎无法为数据集找出正确的特征设计以及如何从图像中识别二维码以进行特征处理。我会使用真实图像还是边缘幅度图?
对此有任何帮助吗?谢谢你的时间。
这个想法是找到
1) 旋转无关和 2) 移位不变特征。
简单地说,傅里叶变换是一个与旋转和平移(移位)无关的特征。计算机视觉中使用的 SIFT 特征可以提取这些特征。这是你可以尝试的。
由于您使用的是 QR 码,我认为边缘幅度图会比图像更好,因为您可以使用图像处理技术来抑制背景中的噪声并突出 QR 码上的边缘。您甚至可以查看自动编码器和 CNN 相关的特征提取。