| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 校内实训项目经验 -> 正文阅读 |
|
[人工智能]校内实训项目经验 |
校内实训项目经验三个项目都是在校内实训时进行的,担任核心开发人员。 《基于?标检测的交通标志识别》(采?yolov4模型)
1.数据集制作,基于CCTSDB数据集,原来是三分类的包括:指示、禁止、警告。 2.语音包制作根据当时的类别标签制作语音包,通过pyttsx3库+百度API+pygame库制作成功。 3.训练模型基于yolo模型,学习了其中darknet53网络。采用了预训练权重,每次训练采用前几轮训练好的模型参数进行训练,降低了loss值。 4.图片识别转视频识别基于opencv模块,增加对于视频进行交通标志识别的功能,对于录制的视频按帧截取识别,确定出候选框,筛选保留置信度最高的框,采用ffmpeg库在拼接成一个视频。 2)、假设B、D与F的重叠度超过阈值,那么就扔掉B、D;并标记第一个矩形框F,是我们保留下来的。 3)、从剩下的矩形框A、C、E中,选择概率最大的E,然后判断E与A、C的重叠度,重叠度大于一定的阈值,那么就扔掉;并标记E是我们保留下来的第二个矩形框。 4)、一直重复这个过程,找到所有曾经被保留下来的矩形框。 5.实时识别并调用语音包功能调取摄像头,每3秒抓取一张图片,传入我们训练好的模型,返回候选框的坐标,在视频流上进行标注,同时返回类别,调用我们生成好的语音包提示。
0代表打开电脑内置摄像头,1代表打开usb插口摄像头。
read() 函数返回的ret是一个bool量,成功读取是true,否则返回false
imshow() :是一个将数组形式的数据转化为图片并展示的函数。它会建立一个窗口,用于展示图片。 想每隔10秒截取一帧,那么就相当于你要每隔( FPS * 10 )帧截取一帧图像!
比如cap.get(0)是获取当前位置以毫秒为单位。
《AI图?篡改检测》(基于faster-rcnn模型)
1.重构voc2007、voc2012数据集将二分类细分成三分类,篡改分为copymove、splicing类别 2.更换网络,服务器运行熟练的在服务器上搭建环境执行代码,同时基于faster-rcnn模型更换里面的vgg16网络换成reset50网络模型,模型速度由9s/iter提升到0.5s/iter 3.flask框架了解学习flask,实现网页上传图片功能,搭建人机交互界面。 4.语义分割
深度学习–Pytorch构建栈式自编码器实现以图搜图任务(以cifar10数据集为例) |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 14:23:22- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |