| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 【目标检测】Faster RCNN -> 正文阅读 |
|
[人工智能]【目标检测】Faster RCNN |
概述Fast RCNN几乎已经是端到端的模型了,并且相较于RCNN速度上有了很大的提升,但是距离实时的检测还有一定距离,当前速度的瓶颈来自于候选框的生成,因为他是跑在CPU上的。所以本文就提出了一个Region Proposal Network(RPN),用于生成候选框,并且,在其中引入了anchor机制,解决多尺度检测的问题。也就是说,Faster RCNN=RPN+Fast RCNN 细节网络结构流程也和Fast RCNN几乎一样,唯一的区别就是候选框的生成方式
RPNPRN网络主要是用于候选框的生成,代替之前的选择性搜索方法,极大的提高了候选框生成的速度。它主要包括anchor生成、anchor分类、bbox回归微调anchor位置得到候选框这几个步骤。
bbox回归我们可以发现Faster RCNN中有两次bbox回归,一次是将anchor的位置进行微调,另一次是对候选框进行微调,两次的操作其实是一样的,就是根据模型输出的四个位置参数调整原来的边框,让它和gt box更加接近。同样的操作在Fast RCNN和RCNN中也出现了。 我们知道一个框可以用四个参数来表示,分别是中心点的xy坐标以及框的宽和高,我们假设原来的框是 [ A x , A y , A w , A h ] [A_x,A_y,A_w,A_h] [Ax?,Ay?,Aw?,Ah?],而真实的表框gt box是 [ G x , G y , G w , G h ] [G_x,G_y,G_w,G_h] [Gx?,Gy?,Gw?,Gh?],我们需要寻找一个变换F,使得 F ( A x , A y , A w , A h ) = [ G x " , G y " , G w " , G h " ] F(A_x,A_y,A_w,A_h)=[G^"_x,G^"_y,G^"_w,G^"_h] F(Ax?,Ay?,Aw?,Ah?)=[Gx"?,Gy"?,Gw"?,Gh"?]并且有 [ G x " , G y " , G w " , G h " ] ≈ [ G x , G y , G w , G h ] [G^"_x,G^"_y,G^"_w,G^"_h]\approx[G_x,G_y,G_w,G_h] [Gx"?,Gy"?,Gw"?,Gh"?]≈[Gx?,Gy?,Gw?,Gh?] 一个简单的思路就是先平移再缩放,我们使用四个参数
[
t
x
,
t
y
,
t
w
,
t
h
]
[t_x,t_y,t_w,t_h]
[tx?,ty?,tw?,th?]就可以描述这个变化,如下: 损失函数与训练Faster RCNN论文中的训练步骤是先训练RPN网络,然后再训练整个Fast RCNN网络。但是两个部分的形式其实差不多,都是分类损失+回归损失,前者用交叉熵损失函数,后者用smooth L1损失函数,虽然长得和Fast RCNN不太一样,但其实是一样的。具体点可以看之前的分析:链接 在训练RPN的时候,一张图片随机选取256个anchors计算loss,正样本anchor和负样本anchor的比例是1:1,如果正样本的个数小于128,那么就用负样本来填充。 训练Faster RCNN作者没提,估计是和Fast RCNN中类似吧。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/25 22:51:07- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |