Ppyolov2 笔记

PP-YOLOv2 是百度对于ppyolo-v1 的升级版,主要是引入了各种插件来提升性能。如下图,ppyolov2 在相同的map下能达到更高的FPS.

PPyolo-v2 的改进点

网络结构图

v2 的整个架构师基于v1 来做的

  • mixup 训练,RandomColorDistortion, Random- Expand, RandCrop and RandomFlip are applied one by one with probability 0.5, 输入大小变化:320, 352, 384, 416, 448, 480, 512, 544, 576, 608
  • baseline model: 改进版的yolov3,见上图,包括:使用resnet50-vd,dcn,ssp, coordconv 等
  • 增加了 PAN结构,毕竟PAN几乎已经成了目标检测的标配
  • 在backnone 使用 mish 激活函数, 更平滑的激活函数有利于梯度的传导?
  • 更大是输入分辨率:320, 352, 384, 416, 448, 480, 512, 544, 576, 608, 640, 672, 704, 736, 768
  • 改进的IOU aware branch.

消融实验结果如下。

对比sota