我读过很多关于 Yolov5 图像检测技术的论文。但是这些论文没有提到 Yolov5 所做的任何分割步骤。虽然我知道没有分割过程就不可能进行图像分类,但我要问以下问题:Yolov5 是否会执行任何分割步骤来检测图像?如果是,它使用哪种分割算法?
没有分割的Yolov5图像检测?
数据挖掘
深度学习
算法
物体检测
图像分割
2022-02-26 22:11:51
1个回答
分割主要使用全卷积网络(FCN)架构。FCN 是一个没有全连接层(FC)的 CNN。分割可以被认为是一个编码器,然后是一个解码器。这里的编码器和解码器是FCN。
使用 CNN 进行分类是一组卷积层(提取输入图像的高级特征),然后是一个或多个全连接 (FC) 层或密集层。最后一个密集/FC 层将输入图像分类为各种类别。
YOLO是一种基于 CNN 架构的基于回归的对象检测算法。在 YOLO 中,图像被分割或分割成 S * S 个网格单元。每个网格单元只预测一个对象,这意味着一个单元试图预测一个中心位于该单元内的对象。对于每个网格单元 CNN 预测
- B个bounding box(x,y,w,h)。(x,y)是一个bounding box相对于cell位置的中心。同时计算每个预测bounding box的confidence score。每个bounding box的confidence score是预测边界框和ground truth边界框的IOU。置信度分数表示边界框包含对象的可能性
- 每个网格单元的 C 条件类概率(每个类一个)。条件类概率是指检测到的对象属于一个类的概率。
CNN 的预测/输出形状为 (S , S, (B * 5 + C)) ;数字 5 代表边界框的 x_center,y_center,width,height 及其置信度分数
如果将图像划分为 7 * 7 个网格单元,每个单元预测 2 个边界框,并且类别总数为 3,则 CNN 输出的形状将为 (7,7,13)
其它你可能感兴趣的问题