IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> YOLOX论文解读 -> 正文阅读

[人工智能]YOLOX论文解读


论文: 《YOLOX: Exceeding YOLO Series in 2021》
代码: https://github.com/Megvii-BaseDetection/YOLOX

创新点

  1. 将YOLO检测器变为anchor-free形式,减少人工设置参数;
  2. 集成了其他先进检测技术(比如decoupled head、label assignment策略SimOTA)取得了SOTA性能;

与YOLO-Nano相比,AP提升1.8%;与YOLOv3相比,性能提升3%;
YOLOX-L,与YOLOv4和v5有相当参数量,在COCO数据集上达到50AP,在V100平台上达到68.9FPS;

算法

Decoupled head

为了解决分类分支与回归分支冲突问题,解耦两分支;
解耦头的作用如下:
1、加快拟合;
2、对end-to-end yolo(指无NMS后处理过程)性能影响比较大;如表1
在这里插入图片描述
具体解耦操作如下:如图2
1、使用11卷积降维到256;
2、增加两个并行分支,每个分支(分类、回归)使用两个3
3卷积;
3、在回归分支额外增加iou分支;
在这里插入图片描述

Strong data augmentation

数据增强主要采用Mosaic 和 MixUp;
mixup检测与分类原理相似;
1、对于尺度不一的输入,通过补0对齐,尺寸使得可以容纳下两张图;
2、相应的loss权重变为mixup参数lambd;

Anchor-free

Anchor-free可以减少设计的参数量及涉及的许多技巧(anchor聚类、Grid Sensitive)

Multi positives

为了与yolov3一致,anchor-free方案中也仅选择一个正样本(gt中心位置),同时忽略其他高质量预测框;
但是由于有些正样本也有正向作用,同时改善正负样本不均衡,因此作者将中心3*3区域作为正样本; 实验结果如表2,AP达到45,超越最好的YOLOv3基线44.3;
在这里插入图片描述

SimOTA

SimOTA过程如下:
1、计算成对预测框与真值框代价,如式1;
在这里插入图片描述
2、计算真值框与前k个预测框iou,其和为Dynamic k;因此对于不同真值框,其Dynamic k存在差异。
3、最后选择代价最小的前Dynamic k个预测框作为正样本;
SimOTA使得AP从45%提升至47.3%;相对于YOLOv3上,性能提升3%,见表2;

End-to-end YOLO

作者跟随参考文献39,增加两个卷积层,一对一分配标签,停止梯度回传,但是性能及推理速度出现下降,如表2。

实验结果

在这里插入图片描述

结论

作何提出一种高性能anchor-free检测器YOLOX,其在性能及速度上达到比较好的平衡;

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-01-25 10:35:14  更:2022-01-25 10:38:30 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 21:49:40-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码