论文:
《YOLOX: Exceeding YOLO Series in 2021》
代码:
https://github.com/Megvii-BaseDetection/YOLOX
创新点
- 将YOLO检测器变为anchor-free形式,减少人工设置参数;
- 集成了其他先进检测技术(比如decoupled head、label assignment策略SimOTA)取得了SOTA性能;
与YOLO-Nano相比,AP提升1.8%;与YOLOv3相比,性能提升3%; YOLOX-L,与YOLOv4和v5有相当参数量,在COCO数据集上达到50AP,在V100平台上达到68.9FPS;
算法
Decoupled head
为了解决分类分支与回归分支冲突问题,解耦两分支; 解耦头的作用如下: 1、加快拟合; 2、对end-to-end yolo(指无NMS后处理过程)性能影响比较大;如表1 具体解耦操作如下:如图2 1、使用11卷积降维到256; 2、增加两个并行分支,每个分支(分类、回归)使用两个33卷积; 3、在回归分支额外增加iou分支;
Strong data augmentation
数据增强主要采用Mosaic 和 MixUp; mixup检测与分类原理相似; 1、对于尺度不一的输入,通过补0对齐,尺寸使得可以容纳下两张图; 2、相应的loss权重变为mixup参数lambd;
Anchor-free
Anchor-free可以减少设计的参数量及涉及的许多技巧(anchor聚类、Grid Sensitive)
Multi positives
为了与yolov3一致,anchor-free方案中也仅选择一个正样本(gt中心位置),同时忽略其他高质量预测框; 但是由于有些正样本也有正向作用,同时改善正负样本不均衡,因此作者将中心3*3区域作为正样本; 实验结果如表2,AP达到45,超越最好的YOLOv3基线44.3;
SimOTA
SimOTA过程如下: 1、计算成对预测框与真值框代价,如式1; 2、计算真值框与前k个预测框iou,其和为Dynamic k;因此对于不同真值框,其Dynamic k存在差异。 3、最后选择代价最小的前Dynamic k个预测框作为正样本; SimOTA使得AP从45%提升至47.3%;相对于YOLOv3上,性能提升3%,见表2;
End-to-end YOLO
作者跟随参考文献39,增加两个卷积层,一对一分配标签,停止梯度回传,但是性能及推理速度出现下降,如表2。
实验结果
结论
作何提出一种高性能anchor-free检测器YOLOX,其在性能及速度上达到比较好的平衡;
|