| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 论文阅读《FSCE: Few-Shot Object Detection via Contrastive Proposal Encoding》 -> 正文阅读 |
|
[人工智能]论文阅读《FSCE: Few-Shot Object Detection via Contrastive Proposal Encoding》 |
论文地址:https://arxiv.org/pdf/2103.05950.pdf 1、存在的问题小样本目标检测的方法存在的不足是:分类任务相对回归任务的错误率更高。 目标框定位通常很准确,但是目标的类别识别经常发生错误。 样本不足,新类学习到的特征不足以去和基类中相近的目标进行区分,所以新类别容易被归结为基类中易混淆的类。 对比学习可以通过降低不同类别目标的相似性来减小类内差异,增大类间差异,这样就可以减少对于相似类别的误判。 对比学习的目标是学习一个编码器,此编码器对同类数据进行相似的编码,并使不同类的数据的编码结果尽可能的不同。 2、算法简介是一个基于微调fine-tune的方法。 第一次将对比学习引入到了小样本目标检测中来。 提出了一种 基于对比建议编码(FSCE)的小样本目标检测方法 ,在RoI 特征提取后添加了一个和回归、分类分支并行的 建议框对比编码(CPE)分支。 训练过程: 然后,将训练好的模型迁移到小数据集上。小数据集是由新类和随机抽样的基类组成的混合数据集(
D
t
r
a
i
n
=
D
n
o
v
e
l
∪
D
b
a
s
e
Dtrain=Dnovel\cup Dbase
Dtrain=Dnovel∪Dbase)。在微调过程中,主干特征提取网络被冻结,联合优化回归损失、分类损失和对比建议损失。 3、算法细节3.1、new-baseline
本文在TFA的基础上提出了一种new-baseline。 new-baseline在解冻RPN和ROI模块的同时应用了以下的两个策略: 2、标准的ROI的batchsize是512,但前景建议框的数量比512的一半还少,因此 将ROI head 中用于损失计算的抽样建议框的数量减少一半。 相当于增加了前景建议框的数量,使得网络学习到了更多的新类特征。 3.2、对比建议编码
为了更好的从小样本中学到更多的目标特征表示,文章提出了一种 批量对比学习方法(batch contrastive learning) 来更好的对 类内相似性 和 类间差异性 特征进行建模。 具体做法是 在ROI head中加入了一个对比分支(contrastive branch),与回归和分类分支并行,用于度量建议框的相似性 对比分支使用1层多层感知机( 1层神经网络),将1 * 1024的ROI特征转化为1 * 128维的对比特征向量 x i x_{i} xi?。随后,计算对比特征向量的相似度分数,并将对比分支的损失加入到总的损失函数中进行优化,使得不同类别距离增大,相同类别距离减少。 采用基于余弦相似度的边界框分类器,计算出RoI 与各个类别的相似性度量。下式表示第 i 个 RoI 与第 j 个类别的相似性度量: 在余弦相似投影的超空间内,对比特征向量使用聚类的方法使得簇内距离更小,簇间距离更大。 3.3、对比建议编码的损失对于每一个mini-batch,有N个ROI特征框,
{
z
i
,
u
i
,
y
i
}
i
=
1
N
\{z_{i},u_{i},y_{i}\}_{i=1}^N
{zi?,ui?,yi?}i=1N?, 在上面的公式中,使用 f ( u i ) {f(u_i)} f(ui?)来减少偏离目标过多的建议框的数目,防止 IoU 得分过低使得proposal 中包含干扰的背景信息。(图像分类的所有语义信息来自于整张图片。而在目标检测问题中,用于分类的语义信息来自于RPN得到的region proposals,有些IOU较低的proposal可能含有较多的非目标信息。) 其中,
z
j
~
=
z
i
∣
∣
z
i
∣
∣
\widetilde{z_{j}}=\frac{z_{i}}{||z_{i}||}
zj?
?=∣∣zi?∣∣zi??,表示归一化特征;
其中,
L
r
p
n
L_{rpn}
Lrpn?是二元交叉熵损失,用于从众多anchor中得到前景proposals、
L
c
l
s
L_{cls}
Lcls?是交叉熵损失,用于proposals分类,
L
r
e
g
L_{reg}
Lreg?是smoothed-L1损失,用于box回归。
4、实验实验参数设置
验证实验PASCAL VOC PASCAL VOC中的20个类别分为15个基类和5个新类。所有来自PASCAL VOC 07+12 trainval集合的基类数据都被认为是可用的,新实例的K-shot是从新类中随机抽取的,K=1、2、3、5和10。 MS COCO 对于COCO中的80个类别,与PASCAL VOC相同的20个类别保留为新类,其余60个类别用作基类。在COCO 2014 val数据集的5K图像上评估了K=10和30个shot的检测性能,并获取了新类的COCOstyle AP和AP75。 消融实验为了确定每个模块的最优参数值进行的消融实验: new-baseline 5、结论引入对比学习的思想 对实例进行建模而不是对类别进行建模 对比分支可以作为二阶段网络的一个即插即用模块 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/25 20:54:58- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |