我需要制作一个模型,在对象周围创建边界框(但不对它们进行分类)以进行比赛。我应该使用哪些库或预训练模型。我需要 x1,x2(x1+w),y1,y2(y1+h) 的值,其中所有尺寸都是从左上角开始测量的。精度是通过 IOU(Intersection over Union)来衡量的。
如何在 Python 中训练用于定位对象(不需要分类)的模型
数据挖掘
机器学习
神经网络
图像分类
图像识别
2022-02-16 21:30:52
2个回答
目前用于在图像中查找对象边界框的主流算法包括:
R-CNN(以及相关Fast R-CNN的和Faster R-CNN)。这一系列算法实际上在两个单独的步骤中进行定位(找到边界框)和分类。它找到边界框然后进行分类。所以如果不需要分类,就跳过第二步。YOLO代表“你只看一次”。这个名字来源于这个算法实际上是一次性完成定位和分类的。
两种算法都可以在主流的python深度学习库tensor-flow中pytorch实现
这是一个很好的例子,如何在 Keras 中使用 YOLO 模型来做到这一点。