深入浅出Yolo系列之Yolox核心基础完整讲解( 二 )


输入端:采用Mosaic数据增强;
Backbone:采用了CSPDarknet53、Mish激活函数、Dropblock等方式;
Neck:采用了SPP(按照DarknetAB的设定)、FPN+PAN结构;
输出端:采用CIOU_Loss、DIOU_Nms操作 。
因此可以看出 , Yolov4对Yolov3的各个部分 , 都进行了很多的整合创新 。
Yolov5网络结构图
深入浅出Yolo系列之Yolox核心基础完整讲解
文章图片
而在Yolov5网络中 , 和Yolov4不同 , 最大的创新点在于 , 作者将网络结构 , 做成了可选择配置的方式 。
比如主干网络结构 , 根据各个网络的宽度、高度不同 , 可以分为Yolov5s、Yolov5l、Yolov5s、Yolo5x等版本 。 这种转变 , 在目标检测领域 , 引领了一股网络拆分的热潮 。
本文的Yolox算法 , 也从这个角度出发 , 将Yolox模型 , 变为多种可选配的网络 , 比如标准网络结构和轻量级网络结构 。
(1)标准网络结构:Yolox-s、Yolox-m、Yolox-l、Yolox-x、Yolox-Darknet53 。
(2)轻量级网络结构:Yolox-Nano、Yolox-Tiny 。
在实际的项目中 , 大家可以根据不同项目需求 , 进行挑选使用 。
3.2Yolox基础知识点
从上面的描述中 , 我们可以知道Yolox整体的改进思路:
(1)基准模型:Yolov3_spp
选择Yolov3_spp结构 , 并添加一些常用的改进方式 , 作为Yolov3baseline基准模型;
(2)Yolox-Darknet53
对Yolov3baseline基准模型 , 添加各种trick , 比如DecoupledHead、SimOTA等 , 得到Yolox-Darknet53版本;
(3)Yolox-s、Yolox-m、Yolox-l、Yolox-x系列
对Yolov5的四个版本 , 采用这些有效的trick , 逐一进行改进 , 得到Yolox-s、Yolox-m、Yolox-l、Yolox-x四个版本;
(4)轻量级网络
设计了Yolox-Nano、Yolox-Tiny轻量级网络 , 并测试了一些trick的适用性;
总体来说 , 论文中做了很多的工作 , 下面和大家一起 , 从以上的角度 , 对Yolox算法的网络结构 , 以及各个创新点进行讲解 。
3.2.1基准模型:Yolov3_spp
在设计算法时 , 为了对比改进trick的好坏 , 常常需要选择基准的模型算法 。
而在选择Yolox的基准模型时 , 作者考虑到:
Yolov4和Yolov5系列 , 从基于锚框的算法角度来说 , 可能有一些过度优化 , 因此最终选择了Yolov3系列 。
不过也并没有直接选择Yolov3系列中 , 标准的Yolov3算法 , 而是选择添加了spp组件 , 进而性能更优的Yolov3_spp版本 。
以下是论文中的解释:
ConsideringYOLOv4andYOLOv5maybealittleover-optimizedfortheanchor-basedpipeline,wechooseYOLOv3[25]asourstartpoint(wesetYOLOv3-SPPasthedefaultYOLOv3) 。
为了便于大家理解 , 大白在前面Yolov3结构图的基础上 , 添加上spp组件 , 变为下图所示的Yolov3_spp网络 。
深入浅出Yolo系列之Yolox核心基础完整讲解
文章图片
大家可以看到 , 主干网络Backbone后面 , 增加了一个SPP组件 。
当然在此基础上 , 对网络训练过程中的很多地方 , 都进行了改进 , 比如:
(1)添加了EMA权值更新、Cosine学习率机制等训练技巧
(2)使用IOU损失函数训练reg分支 , BCE损失函数训练cls与obj分支
(3)添加了RandomHorizontalFlip、ColorJitter以及多尺度数据增广 , 移除了RandomResizedCrop 。
在此基础上 , Yolov3_spp的AP值达到38.5 , 即下图中的Yolov3baseline 。
深入浅出Yolo系列之Yolox核心基础完整讲解
文章图片
不过在对上图研究时 , 有一点点小疑惑:
YOLOv3_ultralytics的AP值为44.3 , 论文中引用时 , 说是目前Yolov3_spp算法中 , 精度最好的版本 。 (thecurrentbestpracticeofYOLOv3) 。
接着对此代码进行查看 , 发现正如论文中所说 , 增加了很多trick的Yolov3_spp版本 , AP值为44.3 。