IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 目标检测:从RCNN、Fast RCNN到Faster RCNN -> 正文阅读

[人工智能]目标检测:从RCNN、Fast RCNN到Faster RCNN

01 传统图像识别方法

传统的图像识别算法解决目标检测问题时,主要分为4个步骤:

(1)在图片上选出所有物体可能出现的区域框,可以是滑动窗口等穷举法。
(2)对(1)步找到的区域卡进行特征提取。
(3)对(2)步提取出来的特征进行分类
(4)通过非极大值一直(Non-maximum suppression)提取结果

其中:
可以对穷举法进行一些改进,使用selective search进行启发式的搜索来发现可能出现图像的区域;
由于CNN对于特征提取的有效性,可以通过CNN来实现步骤(2);
特征提取后,再使用支持向量机SVM进行分类;
最后还是靠非极大值抑制方法来输出结果。

CNN要求所有输入图像的分辨率大小相同,所以需要对于每个区域的图片进行缩放,让他们以同样大小输入CNN中以进行特征提取。


02 RCNN算法

将上述思路进行整理,以CNN的视角重新排列,具体内容如下:
(1)在数据集上训练CNN
(2)在目标检测的数据集上,对训练好的CNN进行微调
(3)用Selective Search搜索候选区域,统一使用微调后的CNN对这些区域提取特征,并将结果存储起来
(4)用存储下来的特征来训练支持向量机

尽管步骤是照搬的传统算法,但是因为CNN强大的能力,这种改进后的算法比传统算法的精确度有显著的提升。这种算法称为区域CNN算法,简称R-CNN


03 第一次改进:空间金字塔池化卷积网络

针对上面的RCNN算法,要做到图像缩放同一大小很繁琐,因此可以在网络上进行改进。

可以使用空间金字塔池化层(Spatial Pyramid Pooling,SPP)来解决这个问题,这种基于空间金字塔池化层的网络被称为SPPNet。(何凯明 《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》

SPPNet中实现分辨率无关的层称为ROI池化层,它的输入是任意大小的卷积,输出是固定维数的向量。
使用了ROI池化层后,可以先对图像进行一遍卷积运算,得到整个图像的卷积特征。
然后,对于原始图像中的各种候选框,只需要在卷积特征中找到对应的位置框,再使用ROI池化层对位置框中的卷积提取特征,就可以完成特征提取工作。

经过改进后,对于区域框中的图像不再需要缩放


04 第二次改进:不使用支持向量机

在分类过程中,使用深度网络替换传统机器学习支持向量机,这种网络被称为Fast RCNN网络(快速区域卷积网络)。(Ross Girshock 《Fast Region-based Convolutional Network》

在实际应用中,有两点需要注意:

  • 一是分类的类别数,不是N,而是N+1类,多出来的那一类是全背景无物体
  • 二是除了分类以外,还需要提供一个做校准的数据,即“框回归”

Fast RCNN使用的VGGNet-16来进行分类。
比起SPPNet,Fast RCNN训练VGG-16的速度提升了3配,测试速度提升了10倍,准确率也有所提升


05 第三次提案网络

经过两次改进,没有缩放需求,分类也变为全连接网络来做,现在唯一传统技术残留就是Selective Search技术。使用神经网络替代它,这样的神经网络就是区域提案网络

最终,可以使用区域提案网络+卷积神经网络+空间金字塔池化卷积网络这3种网络组成的全神经网络,成功地解决了在一张大图片上识别物体的问题。这种网络结构称为Faster RCNN(更快区域卷积网络)

使用残差网络替代VGGNet(《Faster R-CNN Towards Real-Time Object Detection with Region Proposal Networks》

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-10-15 11:47:53  更:2021-10-15 11:49:39 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/11 12:31:06-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码