| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 目标检测—R-CNN、Fast R-CNN和Faster R-CNN -> 正文阅读 |
|
[人工智能]目标检测—R-CNN、Fast R-CNN和Faster R-CNN |
1. 基本介绍本讲进入到深度学习的应用方面,前面提到的卷积神经网络被用作图像分类识别,即输入一张图像,输出它的类别。在实际应用中,我们更有可能遇到的是如下几种将检测、分割与识别综合处理的情形。 第一种情形,单目标检测中的目标定位与识别,即图像中有一个目标,我们需要检测出它的位置,同时识别出它的类别。 第二种情形,多目标检测中的目标定位与识别,即图像中有多个目标,我们需要分别检测出它的位置,同时对每个目标都要进行识别。 第三种情形,语义分割,我们不仅要检测和识别出图像中的各种目标,还要确定每个目标所对应的像素。 这三种情形的难度是逐渐升级的,在本讲及以后的讲解中,我们将会讲到如何处理这三种情形的深度学习算法。 首先,我们针对第一种情形单目标定位与识别,这是目标检测与识别的最简单的情形,相比前面利用卷积神经网络做图像识别的例子,除了要识别目标的类别,我们还要找出目标的位置。 如上图2所示,我们可以采用最简单的方法,在网络的最后一层,增加4个维度的输出,分别代表目标所属方框的左上角坐标点 ( x , y ) (x, y) (x,y),方框的长和宽 ( h , w ) (h,w) (h,w)。当然,图像需要进行归一化,使得这四个坐标在不同的图像中具有等价的关系,然后,我们可以利用卷积神经网络直接获得识别结果。 接下来,我们来看第二种情形多目标检测中的目标定位与识别,即图像中有多个目标,我们需要分别检测出它的位置,同时对每个目标都要进行识别。这种情形相对复杂一些,关键的问题是我们不知道图像中有多少个目标,以及目标在哪里。如果我们在图像中找出一些区域,使得这些区域有且只有一个目标,那么问题便转化为第一种情形了。 2. 目标检测网络2.1 R-CNN在2014年,有研究者提出了
下面主要介绍提取图像候选区域的 给定一张图片(如上图3所示),首先利用 Step1: 利用 结合Step2和Step3就可以得到最终检测的结果。
2.2 Fast R-CNN在2015年, 例如在上面这幅图中,有很多候选区域,而这些候选区域存在非常多的重叠关系。如果把每一个候选区域归一化送入到 下面将通过举例来介绍 如上图6所示,假如有2个候选区域,整幅图片经过 假设在这个特征图上2个候选区域对应的感受野如图中的红色方框所示,大一点的候选区域感受野是
根据不同候选区域在某一层特征图上的感受野,成比例的利用 上图6说明了 2.3 Faster R-CNN
如下图7所示, 网络的局部结构如下图8所示。
下图9是
3. 结尾在这一讲中,详细介绍了目标检测中常用的几个网络,它们分别是 通过这一讲的学习能够获得启发,这三个网络的发展充分说明某个研究领域的进步是不断递进的,后人的工作以前人的工作为基础不断突破,研究人员一起贡献聪明才智,共同推动科学研究向前发展。另一方面,科学研究并非高不可攀。例如最初的 对本将内容感兴趣的读者,可以参考文后的相关论文,了解 参考文献
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/17 20:19:16- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |