IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 滑动窗口操作 -> 正文阅读

[人工智能]滑动窗口操作

目标:? 输出图片中汽车在图片中的位置

步骤: 用一些分类图片, 先训练一个分类的卷积 网络,之后用这个网络进行滑动窗口目标检测。

一开始可以使用适当剪切的图片(也就是整张版几乎都被汽车占据),剪掉汽车以外的部分, 使汽车居于图片的中心位置,基本占据整张图片, 有了这个标签训练集,就可以开始训练卷积网络了,输入这些剪切过的图像,卷积网络输出Y(0或1表示图片中是否有汽车), 训练完这个卷积网络,就可以用它来实现滑动窗口目标检测。

滑动窗口目标检测: 首先选选定特定大小的窗口,将窗口的图片传入深刚才训练的神经网络中, 进行训练, 之后第二个框送入神经网络,思路是以固定步幅滑动窗口,遍历图片中的每个区域,把这些剪切后的小图像( 窗口图像)输入卷积网络, 对每个窗口图像进行0或1的分类,第二步选择更大的窗口重新遍历整个图片

?

?

如何用卷积代替全连接层:

?

?滑动窗口实现:

假设此处使用4个滑动窗口, 蓝色, 绿色,红色,紫色的四个滑动窗口, 这四个窗口经过卷积网络前向传播, 得到一个2*2*4的向量,2*2每个格代表一个候选框, *4表示每一个元素是一个向量。

神经网络中的5*5卷积核 和 2*2POOL核是对图片进行压缩。

?

滑动窗口的缺点:

下面图片情况,可能存在所有窗口都不能完美匹配汽车位置,候选框是蓝色, 是精确的位置应该是红色的框。

?

?

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-12-14 15:56:46  更:2021-12-14 15:58:45 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 1:34:23-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码