没有分割的Yolov5图像检测?

数据挖掘 深度学习 算法 物体检测 图像分割
2022-02-26 22:11:51

我读过很多关于 Yolov5 图像检测技术的论文。但是这些论文没有提到 Yolov5 所做的任何分割步骤。虽然我知道没有分割过程就不可能进行图像分类,但我要问以下问题:Yolov5 是否会执行任何分割步骤来检测图像?如果是,它使用哪种分割算法?

1个回答

分割主要使用全卷积网络(FCN)架构。FCN 是一个没有全连接层(FC)的 CNN。分割可以被认为是一个编码器,然后是一个解码器。这里的编码器和解码器是FCN。

使用 CNN 进行分类是一组卷积层(提取输入图像的高级特征),然后是一个或多个全连接 (FC) 层或密集层。最后一个密集/FC 层将输入图像分类为各种类别。

YOLO是一种基于 CNN 架构的基于回归的对象检测算法。在 YOLO 中,图像被分割或分割成 S * S 个网格单元。每个网格单元只预测一个对象,这意味着一个单元试图预测一个中心位于该单元内的对象。对于每个网格单元 CNN 预测

  • B个bounding box(x,y,w,h)。(x,y)是一个bounding box相对于c​​ell位置的中心。同时计算每个预测bounding box的confidence score。每个bounding box的confidence score是预测边界框和ground truth边界框的IOU。置信度分数表示边界框包含对象的可能性
  • 每个网格单元的 C 条件类概率(每个类一个)。条件类概率是指检测到的对象属于一个类的概率。

CNN 的预测/输出形状为 (S , S, (B * 5 + C)) ;数字 5 代表边界框的 x_center,y_center,width,height 及其置信度分数

如果将图像划分为 7 * 7 个网格单元,每个单元预测 2 个边界框,并且类别总数为 3,则 CNN 输出的形状将为 (7,7,13)