IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> Meta-Learning to Detect Rare Objects (2019 ICCV) -> 正文阅读

[人工智能]Meta-Learning to Detect Rare Objects (2019 ICCV)

1. 出处

2021 ICCV
卡耐基梅隆大学

2. 问题

当前对于小样本学习的研究主要关注小样本分类问题,小样本检测具有挑战而且尚未被探索。也有一些researcher将小样本分类方法用于小样本检测,但效果不够理想。

3. 解决方案

提出了一个基于元学习的框架,能够同时解决小样本分类和定位问题。该框架利用base classes的元知识来促进novel classes检测器的生成。作者的insight就是解决基于CNN的检测模型中类别不可知的和特定类别的组件,利用不同的元学习策略优化不同的组件。

category-agnostic:神经网络较浅层的参数很多类别是共享的,因此是类不可知的。

category-specific:较高层的神经网络,他们的参数是类特定的。

作者把Faster RCNN学到的特征和RPN作为类别不可知的组件,这些参数是base classes和novel classes共享的。分类器和bbox回归器是类别特定的,把参数中的dynamics(动力学)视为base classes和novel classes共享的。

作者提出了一个权重预测元模型,在模型参数空间上进行训练,利用小样本参数来预测类别large-sample bbox检测参数。

4. 模型

设计了小样本检测模型MetaDet,在Faster RCNN基础上构建的。
在这里插入图片描述
(1)模型的训练方式

采用元学习的方式,采样一个个的小任务(episode)。在元训练阶段,每类随机选取K个bbox标注,训练每个类别对应的检测器。

(2)作者的目标是基于base class数据集和novel class数据集估计检测器的参数θ,θ由类不可知的和特定类的组件组成,作者的框架就是要利用检测模型中参数生成的元知识,利用专门的元策略用于不同类型的组件。

category-specific参数不能够直接在base和novel classes中迁移,他们如何从在小数聚集上训练的参数转变为在大数据集上训练的参数,这样的dynamics pattern可以表达成通用的类不可知的转变。

因此作者提出了参数化的权重预测元模型通过元训练过程来学习这种转变。

(3)权重预测元模型

  • large-sample base dataset
    学习检测网络最后几层的class-specific权重
  • k-shot episode dataset sampled from base dataset
    学习对应的权重
    权重预测元模型就是:让小样本检测任务中的权重向large-sample的权重回归

(4)元学习的过程

元训练+元测试

  • 元训练
    分为两个阶段,category-agnostic and category-specific各自对应一个阶段

    • 第一个阶段
      训练基于大量样本的检测器,在整个S_train数据集上。其中基础检测器部分可以用于novel classes和class-specific组件
    • 第二个阶段
      小样本episode检测,利用第一阶段训练好的large-sample基础检测器生成k-shot检测器。冻结category-agnostic参数,重新训练category-specific参数。
  • 元测试
    为了训练k-shot novel检测器,初始化category-agnostic参数为(参照原文中的表达),随机初始化category-specific参数。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-10-22 10:56:24  更:2021-10-22 10:58:31 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/11 9:51:27-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码