深入浅出Yolo系列之Yolox核心基础完整讲解( 三 )


深入浅出Yolo系列之Yolox核心基础完整讲解
文章图片
而Yolox的基准模型 , 是最原始的Yolov3_spp版本 , 经过一系列的改进后 , AP值达到38.5 。
在此基础上 , 又增加了Strongaugmentation、Decoupledhead、anchor-free、multipositives、SimOTA , 等5种trick , 最终达到了AP47.3 。
但存在疑惑的是?
如果直接采用YOLOv3_ultralytics的Yolov3_spp版本 , 再增加上面的4种trick(除掉strongaugmentation , 因为代码中已经改进了) , 是否会有更好的AP提升?
2.2.2Yolox-Darknet53
我们在前面知道 , 当得到Yolov3baseline后 , 作者又添加了一系列的trick , 最终改进为Yolox-Darknet53网络结构 。
深入浅出Yolo系列之Yolox核心基础完整讲解
文章图片
上图即是Yolox-Darknet53网络结构图 。
为了便于分析改进点 , 我们对Yolox-Darknet53网络结构进行拆分 , 变为四个板块:
输入端:Strongaugmentation数据增强
BackBone主干网络:主干网络没有什么变化 , 还是Darknet53 。
Neck:没有什么变化 , Yolov3baseline的Neck层还是FPN结构 。
Prediction:DecoupledHead、End-to-EndYOLO、Anchor-free、Multipositives 。
在经过一系列的改进后 , Yolox-Darknet53最终达到AP47.3的效果 。
深入浅出Yolo系列之Yolox核心基础完整讲解
文章图片
下面我们对于Yolox-Darknet53的输入端、Backbone、Neck、Prediction四个部分 , 进行详解的拆解 。
2.2.2.1输入端
(1)Strongaugmentation
深入浅出Yolo系列之Yolox核心基础完整讲解
文章图片
在网络的输入端 , Yolox主要采用了Mosaic、Mixup两种数据增强方法 。
而采用了这两种数据增强 , 直接将Yolov3baseline , 提升了2.4个百分点 。
Mosaic数据增强
Mosaic增强的方式 , 是U版YOLOv3引入的一种非常有效的增强策略 。
而且在Yolov4、Yolov5算法中 , 也得到了广泛的应用 。
通过随机缩放、随机裁剪、随机排布的方式进行拼接 , 对于小目标的检测效果提升 , 还是很不错的 。