IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 【论文解读】TapNet: Task-Adaptive Projection for Few-Shot Learning(任务自适应映射网络,小样本) -> 正文阅读

[人工智能]【论文解读】TapNet: Task-Adaptive Projection for Few-Shot Learning(任务自适应映射网络,小样本)

1. 介绍

论文地址TapNet: Neural Network Augmented with Task-Adaptive Projection for Few-Shot Learning, PMLR 2019.

针对问题: 在机器学习中,仅给出几个训练示例后处理以前看不见的任务仍然是一个艰巨的挑战。

文章贡献

  • 提出一种基于度量学习的小样本学习算法(TapNet,任务自适应映射网络),其特点是网络与每类的参考向量是多任务学习得到的,每个episode,嵌入向量被线性地映射到一个新的空间,作为一种快速任务特定条件反射的形式。训练损失是基于投影空间中查询向量和参考向量之间的距离度量得到的;

  • 在Omniglot、miniImageNet和tieredImageNet数据集上进行测试时,获得了最先进的分类精度。

2. 方法

2.1 模型方法

????????TapNet由三个关键元素组成:一个嵌入网络fθ、一组每类参考向量Φ和嵌入特征的任务相关的自适应投影M,负责将嵌入网络fθ映射到参考向量Φ。

????????与所有的采用Episode训练方式的算法一样,训练集包含支持集和查询集,与其他的度量学习算法直接计算fθ与到参考向量Φ之间距离的方式不同,本文首先利用一个映射矩阵M,将其投影到一个与任务相关的分类空间中,再度量二者之间的欧氏距离,并利用softmax函数将其转化为分类概率,如下:

????????然后利用分类损失对特征提取网络 fθ和参考向量的集合 Φ进行更新,更新后的fθ与Φ用于下一个Episode的训练中。测试时,训练得到的fθ与Φ是固定的,但映射矩阵M 会根据任务进行自适应调整,然后根据距离度量结果进行类别预测。 最后将查询图像与投影空间中的参考文献进行比较,进行最终分类。

????????总之,嵌入器fθ和每类参考向量Φ是在不同的任务(事件)中学习的,而投影空间M是针对给定任务构建的,提供了一个快速的任务相关条件。这种结合的结果在一个优秀的能力,以推广到新的数据。

2.2 Construction of Task-Adaptive Projection Space

????????寻找映射函数或投影空间M是基于消除嵌入特征和参考之间的不对齐而提出的, 为了处理每个类有多个示例图像的一般情况, 让ck为每个类嵌入特征的平均值,对应于支持集之外的图像。 我们希望找到一个映射器M,使得ck和匹配的参考向量φk在映射空间中高度对齐。 同时,有利于在同一空间内将所有的非匹配权φl与ck很好地分离。

????????利用一个简单的不需要训练的线性映射就解决了该问题,首先在考虑到其他类别参考向量的影响后,得到一个修正后的类别 k对应的参考向量 ?k,计算过程如下:

计算误差向量为:

那么映射矩阵M的目标就是让将映射后的偏差值为0,即嵌入向量与参考向量的映射无限接近,换句话说 M就是偏差 εk? 的一个线性零解。

式中 D表示 的列数,求解上述问题的一个方法就是计算 εk的奇异值分解(SVD):

式中 Σ是一个对角矩阵,且除了对角线上的前 Nc个值之外其他的值均为0,因此只要取右奇异值矩阵 VT 的从第 N c + 1列到第 N c + D列共 D列向量,其构成的矩阵 M就是所求。并且只要偏差 εk 的长度 L ≥ N c + D ,映射矩阵M就一定存在。

2.3 训练策略

3. Experiment Results

少样本分类:

可视化:投影空间

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-07-16 11:17:35  更:2021-07-16 11:19:10 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/22 10:32:15-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码