开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 【目标检测】目标检测界的扛把子YOLOv5（原理详解+修炼指南） -> 正文阅读

[人工智能]【目标检测】目标检测界的扛把子YOLOv5（原理详解+修炼指南）

1.YOLO输入端

在这里插入图片描述

1.1 Mosaic数据增强

Yolov5的输入端采用了和Yolov4一样的Mosaic数据增强的方式。

Mosaic数据增强提出的作者也是来自Yolov5团队的成员，不过，随机缩放、随机裁剪、随机排布的方式进行拼接，对于小目标的检测效果还是很不错的。
在这里插入图片描述

4张图片拼接
随机缩放
随机裁剪
随机排布

算法优点：

丰富数据集
减少GPU计算

1.2 自适应锚框计算

在Yolo算法中，针对不同的数据集，都会有初始设定长宽的锚框。

在网络训练中，网络在初始锚框的基础上输出预测框，进而和真实框groundtruth进行比对，计算两者差距，再反向更新，迭代网络参数。
在这里插入图片描述

Step1：读取训练集中所有图片的w、h以及检测框的w、h
Step2：将读取的坐标修正为绝对坐标
Step3：使用Kmeans算法对训练集中所有的检测框进行聚类，得到k个anchors
Step4：通过遗传算法对得到的anchors进行变异，如果变异后效果好将其保留，否则跳过
Step5：将最终得到的最优anchors按照面积返回

1.3 自适应图片缩放

在常用的目标检测算法中，不同的图片长宽都不相同，因此常用的方式是将原始图片统一缩放到一个标准尺寸，再送入检测网络中。
在这里插入图片描述

letterbox自适应图片缩放技术尽量保持高宽比，缺的用灰边补齐达到固定的尺寸。

2.YOLO总体架构图

在这里插入图片描述

2.1 BackBone

主要进行特征提取，将图像中的物体信息通过卷积网络进行提取，用于后面目标检测。
在这里插入图片描述

2.1.1 Focus模块

Focus层原理和PassThrough层很类似。它采用切片操作把高分辨率的图片拆分成多个低分辨率的图片/特征图，即隔列采样+拼接。
在这里插入图片描述

2.1.2 SPP模块

空间金字塔池化，能将任意大小的特征图转换成固定大小的特征向量。
在这里插入图片描述

2.1.3 CSP_X模块

backbone是较深的网络，增加残差结构可以增加层与层之间反向传播的梯度值，避免因为加深而带来的梯度消失，从而可以提取到更细粒度的特征并且不用担心网络退化。
在这里插入图片描述

2.2 Neck

对特征进行混合与组合，增强网络的鲁棒性，加强物体检测能力，并且将这些特征传递给Head层进行预测。
在这里插入图片描述

2.2.1 FPN

在这里插入图片描述

2.2.2 PAN

在这里插入图片描述

2.3 YOLO输出端

主要进行最终的预测输出。

2.3.1 Bounding Box损失函数

真实检测框和模型预测输出框的吻合程度，用于反向传播优化模型。
在这里插入图片描述

2.3.2 NMS非极大值抑制

判断相邻网格识别的是否是同一物体，消除掉多余检测框。
在这里插入图片描述

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

加:2022-07-04 22:54:12 更:2022-07-04 22:54:21

360图书馆购物三丰科技阅读网日历万年历 2026年3日历

-2026/3/8 2:30:44-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码