数据挖掘 - 没有分割的Yolov5图像检测？ - 吾爱随笔录

数据挖掘深度学习算法物体检测图像分割

2022-02-26 22:11:51

我读过很多关于 Yolov5 图像检测技术的论文。但是这些论文没有提到 Yolov5 所做的任何分割步骤。虽然我知道没有分割过程就不可能进行图像分类，但我要问以下问题：Yolov5 是否会执行任何分割步骤来检测图像？如果是，它使用哪种分割算法？

1个回答

分割主要使用全卷积网络（FCN）架构。FCN 是一个没有全连接层（FC）的 CNN。分割可以被认为是一个编码器，然后是一个解码器。这里的编码器和解码器是FCN。

使用 CNN 进行分类是一组卷积层（提取输入图像的高级特征），然后是一个或多个全连接 (FC) 层或密集层。最后一个密集/FC 层将输入图像分类为各种类别。

YOLO是一种基于 CNN 架构的基于回归的对象检测算法。在 YOLO 中，图像被分割或分割成 S * S 个网格单元。每个网格单元只预测一个对象，这意味着一个单元试图预测一个中心位于该单元内的对象。对于每个网格单元 CNN 预测

B个bounding box(x,y,w,h)。(x,y)是一个bounding box相对于cell位置的中心。同时计算每个预测bounding box的confidence score。每个bounding box的confidence score是预测边界框和ground truth边界框的IOU。置信度分数表示边界框包含对象的可能性
每个网格单元的 C 条件类概率（每个类一个）。条件类概率是指检测到的对象属于一个类的概率。

CNN 的预测/输出形状为 (S , S, (B * 5 + C)) ；数字 5 代表边界框的 x_center,y_center,width,height 及其置信度分数

如果将图像划分为 7 * 7 个网格单元，每个单元预测 2 个边界框，并且类别总数为 3，则 CNN 输出的形状将为 (7,7,13)

其它你可能感兴趣的问题