| 
 | |
| 
 | 
| 开发:
C++知识库 
Java知识库 
JavaScript 
Python 
PHP知识库 
人工智能 
区块链 
大数据 
移动开发 
嵌入式 
开发工具 
数据结构与算法 
开发测试 
游戏开发 
网络协议 
系统运维 教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 | 
| -> 人工智能 -> 校内实训项目经验 -> 正文阅读 | 
|  | 
| [人工智能]校内实训项目经验 | 
| 校内实训项目经验三个项目都是在校内实训时进行的,担任核心开发人员。 《基于?标检测的交通标志识别》(采?yolov4模型)1.数据集制作,基于CCTSDB数据集,原来是三分类的包括:指示、禁止、警告。 2.语音包制作根据当时的类别标签制作语音包,通过pyttsx3库+百度API+pygame库制作成功。 3.训练模型基于yolo模型,学习了其中darknet53网络。采用了预训练权重,每次训练采用前几轮训练好的模型参数进行训练,降低了loss值。 4.图片识别转视频识别基于opencv模块,增加对于视频进行交通标志识别的功能,对于录制的视频按帧截取识别,确定出候选框,筛选保留置信度最高的框,采用ffmpeg库在拼接成一个视频。 2)、假设B、D与F的重叠度超过阈值,那么就扔掉B、D;并标记第一个矩形框F,是我们保留下来的。 3)、从剩下的矩形框A、C、E中,选择概率最大的E,然后判断E与A、C的重叠度,重叠度大于一定的阈值,那么就扔掉;并标记E是我们保留下来的第二个矩形框。 4)、一直重复这个过程,找到所有曾经被保留下来的矩形框。 5.实时识别并调用语音包功能调取摄像头,每3秒抓取一张图片,传入我们训练好的模型,返回候选框的坐标,在视频流上进行标注,同时返回类别,调用我们生成好的语音包提示。 0代表打开电脑内置摄像头,1代表打开usb插口摄像头。 read() 函数返回的ret是一个bool量,成功读取是true,否则返回false imshow() :是一个将数组形式的数据转化为图片并展示的函数。它会建立一个窗口,用于展示图片。 想每隔10秒截取一帧,那么就相当于你要每隔( FPS * 10 )帧截取一帧图像! 比如cap.get(0)是获取当前位置以毫秒为单位。 《AI图?篡改检测》(基于faster-rcnn模型)1.重构voc2007、voc2012数据集将二分类细分成三分类,篡改分为copymove、splicing类别 2.更换网络,服务器运行熟练的在服务器上搭建环境执行代码,同时基于faster-rcnn模型更换里面的vgg16网络换成reset50网络模型,模型速度由9s/iter提升到0.5s/iter 3.flask框架了解学习flask,实现网页上传图片功能,搭建人机交互界面。 4.语义分割
 深度学习–Pytorch构建栈式自编码器实现以图搜图任务(以cifar10数据集为例) | 
|  | 
|  | 
| 上一篇文章 下一篇文章 查看所有文章 | 
| 
 | 
| 开发:
C++知识库 
Java知识库 
JavaScript 
Python 
PHP知识库 
人工智能 
区块链 
大数据 
移动开发 
嵌入式 
开发工具 
数据结构与算法 
开发测试 
游戏开发 
网络协议 
系统运维 教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 | 
| 360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年10日历 | -2025/10/31 18:06:27- | 
| 
 | 
| 网站联系: qq:121756557 email:121756557@qq.com IT数码 |