IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 目标检测模型开发文档v1.0 -> 正文阅读

[人工智能]目标检测模型开发文档v1.0

目标检测模型的数据准备、训练和预测过程开发文档

开发步骤:
一:数据采集与数据标注
二:训练模型
三:测试模型

代码文件:
yolo4_tiny.py,CSPdarknet53_tiny.py定义了一个轻量级模型
loss.py用于计算预测框与真实框的iou以及loss值等
ious.py用于求出预测框以及真实框的位置
utils.py文件中设置了输入进来的图片以及预测框的处理以及训练学习率的调用设置

一:数据采集与数据标注

1:数据集结构:
在这里插入图片描述
JPEGImages文件夹:
原始图像格式必须为jpg格式,避免出错
Annotations文件夹:
该文件夹中存放图像标注的xml文件
ImageSets文件夹:
该文件夹中存放标注类别的每个文件列表信息
train.txt表示训练数据集合
val.txt表示验证数据集合
trainval.txt表示验证跟训练数据集合
test.txt表示测试数据集合

2:数据采集
选择需要检测的目标,按目标采集图片
此处选择目标类别为:人头(head),眼镜(glass),帽子(cap),行人(pedestrian),口罩(mask)

3:数据标注
使用labelImg工具标注图片

4:数据集制作
运行voc2yolo4.py文件会生成四个txt文件
在这里插入图片描述
5:生成图片及标注框位置
运行voc_annotation.py文件会生成三个txt文件
在这里插入图片描述

2007_train.txt中每一行对应图片路径及标注框位置

二:训练模型

训练前在model_data文件夹下创建voc_classes.txt文件,存放需要分类的类别
train.py文件中获得类和先验框
在这里插入图片描述
设置训练数据生成器后读入xml文件,获得框属性
创建yolo模型
在这里插入图片描述
训练文件中可选择是否加载预训练权重
在这里插入图片描述

训练参数的设置
logging表示tensorboard的保存地址
checkpoint用于设置权值保存的细节,period用于修改多少epoch保存一次
reduce_lr用于设置学习率下降的方式
early_stopping用于设定早停,val_loss多次不下降自动结束训练,表示模型基本收敛
在这里插入图片描述
划分验证集和训练集比例为1:9
在这里插入图片描述

开始训练,先冻结后训练,再解冻训练,冻结后训练可以加快训练速度,也可以在训练初期防止权值被破坏
在这里插入图片描述在这里插入图片描述
Init_epoch为训练起始
Freeze_epoch为冻结训练的次数
Epoch为总训练次数
batch_size为一次训练中每次数据读取个数
这些数据可视个人情况设定
运行train.py文件开始训练
在这里插入图片描述

三:测试模型

在yolo.py文件中设置模型路径以及预测框的分数score、交并比iou等
如检测不出目标可适当降低score值
需注意当模型损失率在20左右时可能检测不到目标,应多进行几次训练尽量降低损失率。

运行predict.py文件
在终端中输入:
python predict.py
输入图片名称可测试图片,并将图片保存
在这里插入图片描述
在这里插入图片描述

运行video.py可调用摄像头检测
在终端中输入
python video.py
如果要调用视频测试可将
capture=cv2.VideoCapture(0)
改为
capture=cv2.VideoCapture(“视频路径”)

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-09-15 02:00:48  更:2022-09-15 02:02:57 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/28 18:43:49-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码
数据统计