IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> yolov5-1 -> 正文阅读

[人工智能]yolov5-1

Yolo v5 (v6.1)解析(一)

本文对YOLOv5模型的detect.py文件的参数进行了详细阐述,笔者以后会定期讲解关于模型的其他的模块与相关技术,笔者也建立了一个关于目标检测的交流群:781334731,大家也可扫描最下面图片加入qq群,欢迎大家踊跃加入,一起学习鸭

1.项目地址

源码地址:https://github.com/ultralytics/yolov5

打开网址后,点击master可选取不同版本的分支,本文对Yolov5最新版本v6.1解析
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZJvmz5w9-1651574372865)(C:\Users\宋晨\Desktop\每天任务\assets\image-20220427193834219.png)]

2.环境搭建

在配置Conda环境后就可以进入项目了,可以通过作者提供的requirements.txt文件进行快速安装

即在终端中键入如下指令:pip install -r requirements.txt
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-uK4R44Yw-1651574372867)(C:\Users\宋晨\Desktop\每天任务\assets\image-20220427194120530.png)]

3.代码运行

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zWosquDJ-1651574372867)(C:\Users\宋晨\Desktop\每天任务\assets\image-20220427194309785.png)]
如上是官方给出的代码运行方式,我们可利用Yolov5模型预测图像、视频、摄像头、网站视频、RTSP流文件等,模型会自动下载权重文件(yolov5s.pt、yolov5m.pt、yolov5l.pt等),预测后的结果会自动保存到runs/detect/exp目录下,下次运行结果会保存在runs/detect/exp1目录下,依次类推;下图给出yolov5模型的权重和尺寸,更具体信息请参考:https://github.com/ultralytics/yolov5/releases
在这里插入图片描述

4.模型推理

首先我们可以利用PyTorch Hub工具加载Yolov5模型(如果没下载,会自动下载模型权重到根目录下),之后加载需要检测的图片,最后利用封装好的模型推理检测结果,下图给出具体的实现步骤。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lqEZjeF1-1651574372868)(C:\Users\宋晨\Desktop\每天任务\assets\image-20220427195125517.png)]

5. detect.py文件解读🚀

5.1 检测结果

我们可以直接运行detect.py文件试试效果,运行后系统会把检测结果保存在runs\detect\exp3路径下(之前自己跑过)
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xyMIvWbq-1651574372869)(C:\Users\宋晨\Desktop\每天任务\assets\image-20220427195731606.png)]
下图就是检测结果:
在这里插入图片描述

5.2 参数详解

打开detect.py文件,定位到213行:
在这里插入图片描述

5.2.1 weights

在这里插入图片描述
这个就是指定网络权重的路径,默认是“yolov5s.pt”(default是默认的参数,即使我们在运行时不指定具体参数,那么系统也会执行默认的值);官方提供了很多的版本,需要更换时直接按照替换成对应Model的名字就可以了(当然使用自己训练的模型也是可以的),他会自动的下载对应的权重(如果下载太慢或者失败只能去官网下载了,下载好了直接放到根目录下就可以);下图给出对应模型及其实验结果
在这里插入图片描述

5.2.2 source

这个参数是指定网络输入的路径,默认指定的是文件夹,也可以指定具体的文件或者扩展名等,具体参数可参考上节模型推理
在这里插入图片描述

5.2.3 data

这个就是配置文件的一个路径,配置文件里面包含了下载路径和一些数据集基本信息(在训练时如果不自己指定数据集,系统会自己下载coco128数据集)
在这里插入图片描述
在这里插入图片描述

5.2.4 imgsz, img, img-size

在这里插入图片描述
这个参数是模型在检测图片前会把图片resize成640的尺寸,然后再送进网络中(并不是说会把们最终得到的结果resize成640)

5.2.5 conf-thres

在这里插入图片描述
这个参数是置信度的阈值,置信度通俗来说就是网络对检测目标相信的程度,通常如果设置太小会产生较多的检测框,如果设置过高则可能会过滤掉正确的预测框(因此需要实际根据自己的数据集设置相当的值)

5.2.6 iou-thres

在这里插入图片描述
这个参数是调节IoU的阈值,在NMS(非极大值抑制)后处理用到,NMS具体步骤如下

  • 对 BBox 按置信度排序,选取置信度最高的 BBox(所以一开始置信度最高的 BBox 一定会被留下来)
  • 对剩下的 BBox 和已经选取的 BBox 计算 IOU,抑制IOU 大于设定阈值的 BBox
  • 重复上述两个步骤,直到所有的 BBox 都被处理完,这时候每一轮选取的 BBox 就是最后结果
  • 具体操作可参考下图
在这里插入图片描述
NMS操作流程

5.2.7 max-det

在这里插入图片描述
这个参数是最大检测目标数量,默认是最多检测1000个目标(按照检测置信分排序给出)

5.2.8 device

在这里插入图片描述
这个参数是指定GPU数量,如果不指定的话,他会自动检测

5.2.9 action=‘store_true参数说明

在这里插入图片描述
这个类型的参数和之前的默认有很大区别,其相当于一个“开关”,当我们运行程序的时候如果指定了带有action='store_true’类型的参数,那么就相当于启动这个参数所对应的功能,反之则不

5.2.10 view-img

在这里插入图片描述
这个参数是检测时是否实时的把检测结果显示出来,因为是action='store_true’类型的参数,如果需要在检测时实时显示结果即在终端中输入以下指令 :python detect.py --view-img

5.2.11 save-txt

在这里插入图片描述
这个参数是是否把检测结果保存成一个txt格式的文件,如果需要保存检测结果即在终端中输入以下指令 :python detect.py --save-txt

在文件输出目录runs/detect/exp目录下会生成labels文件夹,这个文件夹下会生成对应图像名的txt文件,里面保存了一些类别信息和边框的位置信息

5.2.12 save-conf

在这里插入图片描述
这个参数是是否以txt格式的文件保存目标的置信度得分,如果单独指定这个命令是没有效果的,需要必须和–save-txt配合使用,即在终端中输入以下指令: python detect.py --save-txt --save-conf

5.2.13 save-crop

在这里插入图片描述
这个参数是是否把模型检测的物体裁剪下来,如果开启了这个参数会在runs/detect/exp/crops文件夹下看到几个以类别命名的文件夹,里面保存的都是裁剪下来的图片

5.2.14 nosave


这个参数是不保存预测的结果,但是还会生成runs/detect/exp文件夹,只不过是一个空的exp

5.2.15 classes

在这里插入图片描述
这里又出现一个新的参数nargs,它的意思就是我们可以给变量指定多个赋值,也就是说我们可以把0赋值给classes,也可以把0、1、2都赋值给classes
在这里插入图片描述
这个参数是只检测给定类别的目标,使用方式是在终端输入:python detect.py --classes 0

5.2.16 agnostic-nms

在这里插入图片描述
这个参数是是否使用增强版的nms,一个trick(笔记使用与不使用这个参数效果相差不大)

5.2.17 augment

在这里插入图片描述
这个参数是在推理时是否使用数据增强方法(对于特定效果会有很好的效果)

5.2.18 visualize

在这里插入图片描述
这个参数是是否把特征图可视化出来,如果开启了这个参数可以看到runs/detect/exp文件夹下又多了一些文件,其中.npy格式的文件就是保存的模型文件,可以使用numpy读写.png就是图片文件

5.2.19 update

在这里插入图片描述
这个参数是对模型进行strip_optimizer操作,去除pt文件中的优化器等信息

5.2.20 project

在这里插入图片描述
这个参数是我们预测结果保存的路径:runs/detect

5.2.21 name

在这里插入图片描述
这个参数是预测结果保存的文件夹名字,默认是exp(第一次是exp,下一次就是exp1),与上面联系起来保存文件路径就是runs/detect/exp

5.2.22 exist-ok

在这里插入图片描述
这个参数是每次预测模型的结果是否保存在原来的文件夹,如果指定了这个参数的话,那么本次预测的结果还是保存在上一次保存的文件夹里;如果不指定就是每次预测结果保存一个新的文件夹下

5.2.23 line-thickness

在这里插入图片描述
这个参数是调节预测框线条粗细

5.2.24 hide-labels

在这里插入图片描述
这个参数是隐藏结果标签(即不显示检测目标类别名)

5.2.25 hide-conf

在这里插入图片描述
这个参数是隐藏标签的置信度(即不显示检测类别置信分)

5.2.26 half

在这里插入图片描述
这个参数是是否使用 FP16 半精度推理;在训练阶段,梯度的更新往往是很微小的,需要相对较高的精度,一般要用到FP32以上;在推理的时候,精度要求没有那么高,一般F16(半精度)就可以,甚至可以用INT8(8位整型),精度影响不会很大;同时低精度的模型占用空间更小了,有利于部署在嵌入式模型里面

5.2.27 dnn

在这里插入图片描述
这个参数是是否使用 OpenCV DNN(Deep Neural Networks)进行 ONNX 推理

参考资料

源码地址:https://github.com/ultralytics/yolov5/tree/master

彩蛋

本文对YOLOv5模型的detect.py文件的参数进行了详细阐述,笔者以后会定期讲解关于模型的其他的模块与相关技术,笔者也建立了一个关于目标检测的交流群:781334731,大家也可扫描下面这张图片加入,欢迎大家踊跃加入,一起学习鸭!
在这里插入图片描述

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-05-05 11:19:11  更:2022-05-05 11:23:39 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/4 16:01:47-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码