YOLO 版本的主要架构变化是什么?

数据挖掘 约洛
2022-02-20 22:30:12

我最近在 Medium 上看到了一篇博客,其中列出了 YOLOX 相对于其前身 YOLOv5 的进步。

进步是:

  1. YOLOX 使用解耦头

有人可以列出随着时间的推移对 YOLO 架构所做的主要优化吗?

1个回答
  1. YOLOv1使用在 ImageNet-100 数据集上训练的 Darknet 框架。该网络有 24 个卷积层,后跟 2 个全连接层。由于系统将输入图像划分为 7 × 7 的网格,因此如果小物体以簇的形式出现或在与训练图像不同的其他维度上出现,则会出现检测小物体的问题。
  2. YOLOv2使用区域建议网络从图像输入和 Single Shot Multibox Detector 中识别对象。它添加了其他功能,例如批量标准化、锚框、多尺度训练等。
  3. YOLOv3使用了一些技巧来改进训练和提高性能,包括边界框预测、类别预测、特征金字塔网络和 Darknet-53 骨干分类器。在这里,Darknet-53 网络用作具有 53 个卷积层的特征提取器,它主要由具有快捷连接的 3x3 和 1x1 过滤器组成。
  4. YOLOv4架构有 4不同的块:主干、颈部、密集预测和稀疏预测。主干是特征提取架构,即 CSPDarknet53。它用于将当前层分成两部分,一部分通过卷积层,另一部分不通过卷积,然后将结果聚合。颈部有助于在主干和密集预测块(头部)之间添加层。头部(密集预测)用于定位边界框和分类。
  5. YOLOv5是一个有争议的方法,因为它是在 YOLOv4 之后几天发布的。由于作者尚未发表任何论文,Alexey Bochkovskiy 在其他框架中将其归类为 YOLOv4。
  6. YOLOX进行了改进,例如解耦头、无锚和高级标签分配策略。我没有测试过,所以我没有评论。