目前,我正在尝试构建一个神经网络,该网络能够仅根据形状对图像上不同类型的瓶子进行分类。瓶子没有标签,起初我只用啤酒和葡萄酒瓶。我的目标是将使用特征提取的神经网络与使用原始图像的神经网络进行比较。
示例输入图像:
https://i.gyazo.com/c22151a4bee6146cc689fcb8358483dd.jpg
使用openCV处理图像,我尝试只获取瓶子的边缘并根据形状对类型进行分类。目前,我收到以下图像结果:
https://i.gyazo.com/8554b06ebf6e8bd520d11222f70c77c5.png
在下一步中,我裁剪了图像中的每个瓶子并将它们拆分为二维数组(通常我尝试使用 30x50,但在此图像中我使用 10x20 显示它)
https://i.gyazo.com/28fb1bc0fa8d61b185ed2245db222cc8.png
对于每个图块,我执行 PCA 以提取特征向量。最后,我收到一个 10x20 瓷砖的矩阵,其中每个瓷砖都包含线条的方向。如您所见, (0.0, 1.0) 元组是垂直线, (1.0, 0.0) 元组是水平线。
https://i.gyazo.com/bcd291535ea01b6392ab6aef6747de9d.png
对不起,很长的帖子,这是我的问题:
是否可以使用这些数据在葡萄酒和啤酒瓶之间进行分类?瓶颈的形状不同,但是否代表构建神经网络?我试图通过计算梯度(来自元组的 arctan)来训练模型,但我没有设法获得一些成功的结果。有谁知道如何预处理神经网络的数据?
使用裁剪后的瓶子图像作为神经网络的图像数据会更好吗?
我很感谢任何帮助,因为这是我的第一个机器学习项目,我真的很想让它工作。