IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 跨域小样本---cross domain few shot---第二弹 -> 正文阅读

[人工智能]跨域小样本---cross domain few shot---第二弹

简单来说就是在Few-shot Learning问题中加入了跨域问题,具体表现在:在一个数据集上进行Few-shot训练,完成后在另一个数据集Few-shot测试,两个数据集中没有相同的类别。

  1. 跨域小样本—cross domain few shot—第一弹

Universal Representation Learning from Multiple Domains for Few-shot Classification (ICCV2021)

问题: 现有解决方案首先会在多个数据集分别训练特征提取器,随后在测试阶段筛选或者融合来自不同提取器的特征,如下图(a)所示,但是针对小样本场景中样本少的问题导致筛选、融合过程难以实现。
创新点: 本文使用对多个特征提取器进行知识蒸馏,从而避免了测试过程中的筛选、融合步骤,下图(b)所示。

具体框架图:

  1. 第一阶段,首先在每个域训练对应的特征提取器 f ? ? f_{{\phi}^*} f???域分类器 h ψ ? h_{{\psi}^*} hψ??
  2. 第二阶段,将所有的 f ? ? f_{{\phi}^*} f??? h ψ ? h_{{\psi}^*} hψ??冻结,然后使用知识蒸馏来学习 f ? f_{\phi} f??
    2.1 特征约束: 在知识蒸馏阶段,每个域图像分别进入各自的特征提取器 f ? k ? f_{{\phi}_k^*} f?k???,并进入 f ? f_{\phi} f?? f ? f_{\phi} f??的输出特征会进入对应的域适配器 A θ k A_{{\theta}_k} Aθk??进行线性变换。最后使用CKA (一种骚距离度量) f ? k ? f_{{\phi}_k^*} f?k??? A θ k A_{{\theta}_k} Aθk??的输出进行约束。
    2.2 结果约束: f ? f_{\phi} f??的输出输入到对应的 h ψ k h_{{\psi}_k} hψk??中得到分类结果, f ? k ? f_{{\phi}^*_k} f?k???的输出输入到冻结的 h ψ k ? h_{{\psi}^*_k} hψk???得到分类结果,计算两种结果的KL损失。
  3. 两种约束能够在不同层面上帮助网络进行知识蒸馏,在测试阶段使用 f ? f_{\phi} f??作为特征提取器,在support-set上训练一个 A ? A_{\vartheta} A??,最后参考Few-shot分类范式,使用 f ? f_{\phi} f?? A ? A_{\vartheta} A??完成query-set的分类。

Cross-domain Few-shot Learning with Task-specific Adapters (CVPR2022)

跟上一篇出自同一个团队 (很专注)
创新点: 去除了迁移过程中繁琐的adapter步骤,将task adaptation依附在训练过程中,在训练过程中完成适配。

具体框架:

  1. 在ImageNet上训练得到特征提取器 f ? f_{\phi} f??

  2. support-set中,在冻结的 f ? f_{\phi} f??的各个层间加入 task-specific weights: ? \vartheta ?,具体是加入各种变换。将经过这些变换后得到的特征输入到分类器 p ( ? , ? ) p_{(\phi,\vartheta)} p(?,?)?中进行分类。

  3. 超级总结: 在冻结的特征提取器 f ? f_{\phi} f??的层之间加入 1 × 1 1\times1 1×1卷积,并最后一层再加入线性变换器 A β : R d → R d A_{\beta}:R^d\rightarrow R^d Aβ?RdRd。这些简单的操作,再Few-shot setting下就有了神奇的魔力。因为Few-shot是基于episodes训练的,所以训练过程中这些 1 × 1 1\times1 1×1卷积层与最后的变换器拟合了大量的task,具备了元迁移的能力(非常玄乎),为什么有效呢?我认为这种设定,在单domain训练中能够起到增强特征的作用,类似增加一些扰动进去,会增强特征的泛化性;在多domain训练中,由于episodes训练的原因,网络能够收集不同域的经验,起到文中提到的适配的作用,最终适配不同域的数据。

跨域数据集

多源域自适应矩阵匹配:Moment Matching for Multi-Source Domain Adaptation,ICCV2019

收集并注释了迄今为止最大的UDA数据集DomainNet,存在显著的领域差距和大量的类别,它包含6个域和分布在345个类别中的约60万幅图像。
在这里插入图片描述

Meta-Dataset: A Dataset of Datasets for Learning to Learn from Few Examples(ICLR )

相较于上一篇,数据集是按领域来划分,即数据集间没有类别交叉
在这里插入图片描述

MSeg: A Composite Dataset for Multi-domain Semantic Segmentation

综合好几个分割数据集(多数为街景)为一个大的数据集,将类别进行了更加精细的处理。
在这里插入图片描述

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-05-21 18:58:09  更:2022-05-21 19:01:48 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/1 22:35:06-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码