IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 论文阅读《FSCE: Few-Shot Object Detection via Contrastive Proposal Encoding》 -> 正文阅读

[人工智能]论文阅读《FSCE: Few-Shot Object Detection via Contrastive Proposal Encoding》

提出了一种对比表征嵌入的方法来来实现小样本目标检测,观察到使用不同的 IoU 来检测物体与对比学习方法中对比不同“正对”和“负对”来实现分类有异曲同工之妙以及好的特征嵌入是提升小样本学习性能的关键。动机是观察到模型的错误更有可能是误分类而不是定位,本文解决这一问题的方法是对“正对”和“负对”施加了对比嵌入损失(CPE loss),使“正对”的得分远大于“负对”的得分,在当时的 PASCAL VOC 和 COCO 数据集上均达到了 SOTA。

“正对”、"负对"示例

在有监督对比学习的图像分类任务中,使用数据扩增来丰富“正对”。而在检测任务中对同一物体不同 IoU 值的 proposal,也可以看作是一种对“正对”的补充。

常见的二阶段检测模型 Faster Rcnn 的 RPN 模块可以很好的找出前景区域,最后的回归层也可以很好地定位出新颖类别的物体。在大数据集上两类相似物体的余弦相似度可以达到0.39,物体和背景的余弦相似度则为-0.21。而在小样本学习的设定下,相似物体的相似度可达到0.59,更容易出错。因此得出结论模型的错误更有可能是误分类而不是定位,文中也做了一个统计,如果能纠正分类错误的话新颖物体的平均检测精度可以涨20个点。

度量学习算法更关注对区分不同物体更有效的高层表征,而不是聚焦在像素级别的细节上。

传统的迁移学习方法违反直觉的地方是:FPN 和 RPN 学习到的提取 base instance 特征的能力可以直接迁移到提取 novel instance 的特征上。但是如果迁移后不冻结 FPN 和 RPN 的话,又会影响精度。但文中提出如果采用适当的训练策略,可以提高传统迁移学习的精度,文中称为 Strong Baseline。

Strong Baseline

大家一直都认同的一个观点是越多的模型组件被 fine tune,在 novel instance 上的精度就会越低。但是文中发现在 base 数据集和 novel 数据集上从 positive anchor 中挑出的 proposal 的数量差距很大,后者只有前者的四分之一,前景的 proposal 数量的差距同样也很大。

主要问题在于 RPN 使得 positive anchor 的得分太低,在经过 NMS 后剩下的 proposal 太少以及 proposal 的数量太少,导致背景的 proposal 主导了梯度下降。为了解决这两个问题,将 NMS 之后留下来的 proposal 的最大数量增加一倍,将 Head 中用来计算损失的 proposal 的数量减少一半。取得了不错的效果,对比的 baseline 是《Frustratingly simple few-shot object detection》,这里可以看作是两个 trick。

FSCE

在模型的 Head 增加了一个对比分支,这个分支度量了 proposal 的相似性。这个分支附带了一个损失函数,contrastive proposal encoding (CPE),用来将同一类别的实例凑的更“近”,而不同类别尽可能“远”的分离。这个对比分支使用一个 MLP 来实现,将 RoI 编码成一个128维的向量,即一个对比表征嵌入。使用这个嵌入来计算相似度得分以及将这个部分的损失函数 CPE 附加到总的损失函数里,这个 Contrastive Head 引导 RoI 学习易于对比的表征嵌入。这个对比分支可以作为二阶段网络的一个即插即用模块。

FSCE Overview

采用基于余弦相似度的 Box Classifier,计算 RoI 与各个类别的相似性度量,下式表示第 i 个 RoI 与第 j 类物体的相似性度量。

α 是超参数,用来放大梯度,文中采用20。

在余弦相似投影的超空间内,对比表征嵌入可以使得簇内距离更小,簇间距离更大。

训练过程分为两个阶段:首先在通用的大数据集上训练 Faster Rcnn。之后将其迁移到小数据集上,这个小数据集包括 novel instance 以及从大数据集里随机选取的 base instance。第二个阶段的训练冻结 backbone 的参数,更新 Neck 和新加上对比分支的 Head 的参数及损失函数。

\lambda?取0.5。

CPE Loss

对于一个小批量 N 的 RoI features,有?\left \{ z_{i},u_{i},y_{i} \right \}_{i=1}^{N},其中 zi 是第 i 个 proposal 的对比表征嵌入,ui 是 IoU 的得分,yi 是 ground truth 的标签。CPE Loss 定义为

Nyi 是标签为 yi 的 proposal 的数量,zi*zj 代表了余弦相似度。\tau?是正则项,这里对对比表征嵌入和正则项有一个消融实验。

and τ is the hyper-parameter temperature as in In- foNCE [48].

《Representa- tion learning with contrastive predictive coding》

f(ui) 是为了防止 IoU 得分过低使得 proposal 中包含干扰的背景信息而定义的,包含阈值项和一个权重函数。

g() 为不同的 IoU 分配不同的权重参数,而?\phi?取0.7,这里有一个消融实验。

?t-SNE 证明了该损失函数的有效性。

Experiment

PASCAL VOC

可以看到迁移后的模型在 base 数据上精度依然有很大提升。

COCO

Conclusion

FSCE 对实例进行建模而不是对类别进行建模,通过 CPE Loss 来建模同一类别实例的相似性,指导 Contrastive Head 来学习易于对比的嵌入表征。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-08-09 10:14:30  更:2021-08-09 10:16:56 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 22:41:14-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码