| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 论文阅读《Matching Networks for One Shot Learning》 -> 正文阅读 |
|
[人工智能]论文阅读《Matching Networks for One Shot Learning》 |
提出了一种基于度量学习和利用外部记忆来增强网络的方法,用一些有标签的 support set 来推测无标签的 query,是一种小样本的图像分类的方法。 18年的文章,可以说是小样本学习领域的经典文章。文章自己认为的创新有两面,一个是在模型层面提出 Matching Net,第二个是遵循了一个简单的机器学习准测:训练与测试的数据分布必须相近(这也算创新?)。提出了在 ImageNet 上的一个 benchmark。 文章提到了几个激发他们灵感的网络,大都有神经注意力机制,可微分并且使用一个外部记忆来解决任务。可以理解为,其中 A 为 support set,B 为 query set。 Matching Network
对于每一个 support set S(small),训练一个分类器 Cs,对每一个输入 x(可以是图片也可以是句子),输出其可能的概率分布: xi 和 yi 是 support set 中的数据,?和??是 query set 中的数据,P() 使用模型来实现的,a(文中形容为 attention mechanism 不知该这么理解)是一个核函数。这个公式可以看作是对 support set 中数据的线性组合,这个公式类似于一个核密度估计。选用合适的距离函数和常数,对于离??第 b 近的 xi,a() 的结果都是0,这时这个公式等价于 “k-b” 近邻。 另一个解释的角度是把这个公式看作一个 hash 表,每一个 xi 都有对用的响应 yi。就像有了可以联想的记忆,给定一个输入我们可以检索出 support set 中与之类似的案例。 因此分类器 Cs 的形式非常灵活,并且很容易就可适应到新的 support set 上。query 应能与 support set 中相一致的图片类别相对齐。 这个 a() 最简单的实现方法是使用余弦距离和 softmax。
利用 f 和 g 来表征 support 和 query 的嵌入,文章认为 support 应该不仅影响 g?表征的方式,也应该能够影响 f 表征 query 图片的方式。g 的表征方式用双向的 LSTM 来实现,使其能够充分编码 support set 内的信息,support 影响 f 表征 query 的方式也是使用 LSTM: LSTM 不展开。
对一个任务 T 和带标签的数据 L,最多包含5类,每一类最多有5张图片。例如 L 可以是 {cats, dogs},需要抽样出 support set 和 query set B,都是带标签的包含 cat 和 dog 的图片。Matching Net 的任务是减少通过 support set 对 B 进行分类的损失,其损失函数如下:
训练完成后,在 novel 类别中再抽样出 S' 和 T',再调用 θ 完成分类任务,当 T' 与 T 相差较大时效果不好。 Experiments在 L 上完成训练,在 L' 上完成测试。也测试了经过 L’ 微调后的性能。
在两个数据集?Omniglot 和?ImageNet 上的 N-way k-shot 分类任务。
分别测试了在三个子数据集(randImageNet、dogsImageNet、miniImageNet)和 ImageNet 上的性能。还完成了对上面介绍的外部记忆的消融实验,原文中称作?Full Contextual Embeddings (FCE)。 randImageNet 是在训练集中抽了118个类的118张图片,仅在这些图片上做测试,记作 Lrand。 dogsImageNet 是在除了包含 dog 的类别上训练,在包含 dog 的类别上做测试。 在?ImageNet 上采用的 baseline 是?Inception,用 Inception 的分类器初始化了 Matching Net 中的 f 和 g,再以?5-way 1-shot 的方式在训练集进行训练。
Conclusion如果训练网络进行 one-shot,那么 one-shot 会容易得多。 神经网络中的非参数结构使网络更容易记忆和适应相同任务中的新数据集。 附加
是对直方图的扩展,针对直方图存在的不连续、受终点影响大、受间隔影响大等缺点进行的改进。将每个数据点替换成相应的核函数(比如高斯核函数),再将所有点的值叠加再归一化,即得到核密度估计曲线。带宽选择也十分重要。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/12 0:53:53- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |