Yolox阅读笔记
yolox 是旷世今年推出的一个新的YOLO检测器技术报告,核心是将YOLO与anchor free方式实现,性能超过了之前的YOLO系列。此笔记记录YOLOx做了哪些改良.
Yolox 的构成
yolov3 baseline
darknet53 作为backbone,增加 SPP结构; 训练策略有:EMA,cosine lr schedule, IoU loss and IoU-aware branch. RandomHorizontalFlip, ColorJitter and multi-scale for data augmentation.
decoupled head
原始的一系列YOLO算法中回归器、分类器合在一起。在RetinaNet里面已经验证了分开能提高性能,这也很明显,各司其职,参数增加,提升性能。如下图

yolox 将回归、分类、IOU预测都解耦作为单独的分支。

从上图可以看出,解耦后能加快收敛,前期各司其职。但是随着训练轮次的增加,最后二者达到的AP趋于一致.
Strong data augmentation
Mosaic and MixUp
Anchor-free
这是YOLOx 最大的区别,还能叫YOLO吗?😄
yolox anchor free 实现细节:
每个位置只预测一个目标,且直接预测四个值,分别是相对网格左上角的偏移以及预测框的高和宽。
正样本分配:
- 物体中心点所在位置设为正样本,一个点最多一个正样本. 以此种方式分配正样本 AP 可达 42.9
- Multi positives– 以上诉正样本为中心点,取四周9个为正样本,这个和YOLOv5 的分配机制一样,增加正样本数量,加快收敛,AP提升到 45
- SimOTA: 该样本分配方式基于旷世的OTA论文的改进,具体这儿不抠细节了,AP能提升到 47.3
vs sota
对比YOLOv5

vs sota
