| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 《目标检测》R-CNN、SPP-NET、Fast R-CNN、Faster R-CNN -> 正文阅读 |
|
[人工智能]《目标检测》R-CNN、SPP-NET、Fast R-CNN、Faster R-CNN |
学习内容来自:https://www.bilibili.com/video/BV1m5411A7FD?p=2 一:目标检测的含义 这个任务本质上就是这两个问题:一:图像识别,二:定位。 定位(localization): 这个框框有个专有名词叫做bbox(bounding box),真正人为标记的bbox叫做groundtruth bbox,后面我们会讲到的模型预测出来的叫做predicted bbox。 二:目标检测的分类 三:目标检测的简单实现思路,简单模型。 看似很简答?啊不,其实这个模型的问题很多,后面会慢慢说来。 四:目标检测方法之R-CNN 这种虽然也是解决问题的思路,不过过于暴力枚举求解,会造成耗费大量的计算量,并且窗口的大小尺寸往往不是很好匹配(窗口匹配不特别准确)。 2:选择性搜索 2014年,RBG(Ross B. Girshick)使用Region Proposal + CNN代替传统目标检测使用的滑动窗口+手工设计特征,设计了R-CNN框架,使得目标检测取得巨大突破,并开启了基于深度学习目标检测的热潮。 R-CNN的简要步骤如下 (2)利用选择性搜索Selective Search算法在图像中从下到上提取2000个左右的可能包含物体的候选区域Region Proposal (3)因为取出的区域大小各自不同,所以需要将每个Region Proposal缩放(warp)成统一的227x227的大小并输入到CNN,将CNN的fc7层的输出作为特征,每个特征是4096维的向量。 (4)将每个Region Proposal提取到的CNN特征输入到SVM进行分类(2012年以前用SVM挺多的,现在图像识别等任务,谁还用SVM啊) (5) 使用非极大抑制(NMS,non-max ),去掉其中的重复的框。 (6) 上述步骤完了后,得到框框是真的是最好的么?能不能效果更好点?框的位置更准确点呢?就其实把SS算法的框和ground trunth的框做个微调,能让框位置信息更准确些。同时把Region Proposal提取到的CNN特征输入到Box regressor中进行精细修正候选框位置,对于每一个类,训练一个线性回归模型去判定这个框是否框得完美。 R-CNN的缺点: 有什么提速的训练方法么?且看SPP-NET。 五:目标检测之SPP-NET 将原来候选区域的的位置映射到特征图向量中的对应的位置,然后映射后的特征向量经过SPP层,得到固定大小的特征向量输入到FC层。 这一子解决了卷积次数多耗时的问题,也不用对候选区域做调整尺寸大小的操作。 我们先看看映射: 再看看SPP-NET 请注意SPP-NET处理输入的是一个个映射后的在特征图上的候选区域,用不同的子图划分,使用max pooling后将其连接起来组成固定维度的输出。 SPP-NET虽然加速了使用的速度,但是SPP-NET依然很慢 六:物体检测之Fast R-CNN (1)ROI pooling layer实际上是SPP-NET的一个精简版,SPP-NET对每个proposal使用了不同大小的金字塔映射,而ROI pooling layer只需要下采样到一个7x7的特征图。对于VGG16网络conv5_3有512个特征图,这样所有region proposal对应了一个77512维度的特征向量作为全连接层的输入。这一步就是只使用一种子图划分,单尺度的,就是为了减少计算量的一种方式啦,作用和SPP-net的SPP层是一样的。 多任务损失: 完了后速度就快了很多。 缺点还是: 七:物体检测之Faster R-CNN Fast R-CNN存在的问题:存在瓶颈,选择性搜索,找出所有的候选框,这个也非常耗时。那我们能不能找出一个更加高效的方法来求出这些候选框呢? 解决:加入一个提取边缘的神经网络,也就说找到候选框的工作也交给神经网络来做了。 增加的区域生成网络RPN(region proposal network)替换了SS算法。
RPN原理 anchor就是位置和大小固定好了的box,可以理解成事先设置好的固定的proposal,proposal就是任意尺寸大小的了。 因此Faster R-CNN是包含有四个损失函数 八:二阶段的方法的最后总结 最后总结一下各大算法的步骤: Fast R-CNN Faster R-CNN |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/1 12:26:18- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |