| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 滑动窗口操作 -> 正文阅读 |
|
[人工智能]滑动窗口操作 |
目标:? 输出图片中汽车在图片中的位置 步骤: 用一些分类图片, 先训练一个分类的卷积 网络,之后用这个网络进行滑动窗口目标检测。 一开始可以使用适当剪切的图片(也就是整张版几乎都被汽车占据),剪掉汽车以外的部分, 使汽车居于图片的中心位置,基本占据整张图片, 有了这个标签训练集,就可以开始训练卷积网络了,输入这些剪切过的图像,卷积网络输出Y(0或1表示图片中是否有汽车), 训练完这个卷积网络,就可以用它来实现滑动窗口目标检测。 滑动窗口目标检测: 首先选选定特定大小的窗口,将窗口的图片传入深刚才训练的神经网络中, 进行训练, 之后第二个框送入神经网络,思路是以固定步幅滑动窗口,遍历图片中的每个区域,把这些剪切后的小图像( 窗口图像)输入卷积网络, 对每个窗口图像进行0或1的分类,第二步选择更大的窗口重新遍历整个图片 ? ? 如何用卷积代替全连接层: ? ?滑动窗口实现: 假设此处使用4个滑动窗口, 蓝色, 绿色,红色,紫色的四个滑动窗口, 这四个窗口经过卷积网络前向传播, 得到一个2*2*4的向量,2*2每个格代表一个候选框, *4表示每一个元素是一个向量。 神经网络中的5*5卷积核 和 2*2POOL核是对图片进行压缩。 ? 滑动窗口的缺点: 下面图片情况,可能存在所有窗口都不能完美匹配汽车位置,候选框是蓝色, 是精确的位置应该是红色的框。 ? ? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 1:34:23- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |