[人工智能] (二)元学习算法MAML解读

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> (二)元学习算法MAML解读 -> 正文阅读

[人工智能](二)元学习算法MAML解读

欢迎访问个人网络日志🌹🌹知行空间🌹🌹

元学习算法MAML简介

论文： Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks Chelsea

代码： https://github.com/cbfinn/maml

ICML2017的一篇论文，作者Chelsea Finn是斯坦福的老师，一不小心去作者主页看了下，MIT和伯克利的学生，真强。^_

元学习MAML论文介绍

模型无关元学习算法，即Model-Agnostic Meta-Learning Algorithm(MAML)。

1.元学习(meta learning)

元学习即学会学习，区别与普通的深度学习过程。普通的深度学习具体到某一任务，如图像分类，即训练一个模型实现一个数据集内的图像分类，这种方法有一定的局限性，即模型只能在当前任务(task)上工作，不能应用到其他任务。譬如基于手写字识别数据集训练的分类模型不能用来实现猫和狗的分类。有没有一种方法，可以学会完成分类这一任务，不针对具体是实现哪些对象的分类，学会分类任务后再基于少量的具体数据训练学会是具体给猫狗分类还是给手写字分类。相当于说一个模型实现了原来多个模型的功能。

元学习训练模型是为了获得一个可以快速应用到小样本数据的新任务上的模型，元学习通过初步训练获得模型比较好的初值，再基于初值对具体任务在小样本训练数据上少量更新权重即可取得好的效果。

元学习还可以理解成是寻找一组具有较高敏感度的参数，基于找到的参数，只需要进行少量的迭代即可在新的任务上取得理想的结果。

元学习可应用于训练数据有限的Few-Shot Learning任务。

2.模型无关元学习

2.1 元学习问题建模

元学习是在一系列任务上学习，目标是学习得到一个比较敏感的模型，使该模型能够基于小样本数据简单训练快速应用到新任务上。也就是说，元学习将一系列学习任务当作训练样本。

譬如，识别一个动物是不是狗是任务 $T_1$ ，识别一个手写数字是不是9是任务 $T_2$ ,识别一辆车是不是坦克是任务 $T_3$ ,普通的学习方法会针对每个训练一个模型，也是基于前述的任务要训练3个模型分别完成。观察前面的三个任务 $T_1,T_2,T_3$ 具有共性，即都是识别分类任务，能不能有一种通用模型可以学习识别分类这一任务，然后再基于少量的数据对通用模型微调即可快速应用的新的类似任务。如基于 $T 1, T 2, T 2$ 使模型学会分类能力，然后提供少量的是否是飞机的训练数据，即可快速学会判断天空中的一个物体是否是飞机。

使用数学公式描述：

单个任务表示为:
$T=\{L(X_1,a_1,...,X_H,a_H),q(X_1),q(X_{t+1}|X_t,a_t),H\}$

$X$ 是输入
$a$ 是输出
$L$ 是损失函数
$q(X_1)$ 是初始输入变量的概率分布
$q(X_{t+1}|X_t,a_t)$ 是输入变量的状态转移分布
$H$ 输入变量序列的长度，对于监督学习问题，其值为1，应用在强化学习等中。
$L(X_1,a_1,...,X_H,a_H) \rightarrow \R$ 是针对具体任务的损失函数，如回归问题通常是均方误差(Mean Square Error, MSE)，分类问题通常是交叉商(Cross Entropy, CE)。

在元学习(meta-learning)中，考虑多个任务 $T$ 的分布为 $p (T)$ ,这正是元学习模型要学习的目标。具体的任务 $T_i$ 是从任务分布 $p (T)$ 中取样的，模型的训练基于任务 $T_i$ 的 $K$ 个训练样本和任务 $T_i$ 的损失函数 $L_i$ 。任务 $T_i$ 的测试误差，将作为元学习模型的训练误差。

在这里插入图片描述

上图中 $\nabla L_1,\nabla L_2,\nabla L_3$ 分别表示任务 $T_1,T_2,T_3$ 上的损失函数梯度， $\theta_1^\star,\theta_2^\star,\theta_3^\star$ 分别表示具体到任务 $T_1,T_2,T_3$ 上的参数， $\theta$ 是元学习模型的参数。

2.2 MAML算法

在这里插入图片描述

算法中参数更新分成两步，一次是更新
$\theta'$ ,之后才是更新 $\theta$ 。这和元学习的的定义相关。 $\theta'$ 的更新是在具体某个 ${Task}_i$ 上学习时发生的，而元学习的目标是找到一组参数 $\theta$ 能够对多个任务 $T a s k$ 都具有表征能力。所以 $t h e t a$ 的更新过程分成了两个，先是针对具体任务 $Task_i$ 的更新优化后是针对元学习模型的优化。

第一步，针对任务 $T_i$ 的模型优化为：

$\theta'=\theta-\alpha\nabla_{\theta}L_{T_i}(f_\theta)$

$f_\theta$ 表示元学习模型

第二步，针对元学习模型的优化为：

$\mathop{min}\limits _\theta \sum\limits_{T_i\sim p(T)}L_{T_i}(f_\theta')=\sum\limits_{T_i\sim p(T)}L_{T_i}(f_{\theta-\alpha\nabla_{\theta}L_{T_i}(f_\theta)}) \\ \\ \theta \leftarrow \theta - \beta\nabla_\theta\sum\limits_{T_i\sim p(T)}L_{T_i}(f_\theta')$