| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> MetaSelector:基于用户级自适应模型选择的元学习推荐 -> 正文阅读 |
|
[人工智能]MetaSelector:基于用户级自适应模型选择的元学习推荐 |
文章目录前言
Abstract现在小曾哥带你们看看这篇文章讲的什么?
Background什么叫元学习?概念:元学习(Meta-Learing),又称“学会学习“(Learning to learn), 即利用以往的知识经验来指导新任务的学习,使网络具备学会学习的能力。 元学习与机器学习的区别
右图所示:元学习,输入的是D_train的任务,希望能够学习出F,不需要人工设计算法等,希望通过多个输入的任务,然后学习出一个算法或者网络参数,最终输出最优函数f,然后根据训练集中的测试集,作用于f来判断猫的标签。
其中需要注意的是,机器学习的目的是找到一个Function,直接作用于特征和标签,寻找特征与标签之间的关联;元学习是寻找一个大Function,用于寻找新的f,新的f才会对应具体的任务 元学习数据分布
推荐系统概念:随着信息技术和互联网技术的发展,人们从信息匮乏时代步入了信息过载时代,在这种时代背景下,人们越来越难从大量的信息中找到自身感兴趣的信息,信息也越来越难展示给可能对它感兴趣的用户,而推荐系统的任务就是连接用户和信息,创造价值。 Contributions:
MethodMetaSelector framework
基本模型模块基本模型M是指参数化推荐模型,例如LR或DeepFM;具有参数θ的模型M用M(·;θ)表示,这样,给定特征x时,该模型输出M(x;θ)作为真实标签y的预测。 模型选择模块该模块包含一个在基本模型模块之上运行的模型选择器S,模型选择器S将数据特征x和基础模型M(x;θ)的输出作为输入=(M(x;θ1),M(x;θ2),…,M(x;θK)) θ=(θ1,θ2,…θK),并输出基本模型的分布。
训练MetaSelectorMetaSelector与以前的模型选择方法区分开的关键因素是,我们使用元学习来学习模型选择器S, 用MAM联合学习模型选择器和基础模型 Episodic Meta-training元训练过程以轮次来进行, 在每轮中,从大量训练人群中抽取一批用户作为任务(第5行)。 对于每个用户u,从Du采样一个支持集DuS和一个查询集DuQ,它们分别被视为对应于用户u的任务中的“训练”集和“测试”集(第7行),对应于每个任务Task来说执行内循环(8-18),在内循环结束后进入外循环,得到θu和φu的损失函数来更新选择器中的初始化参数φ和基础模型的参数θ(第20行) Inner task Adaptation下面我们就来单独分析内循环过程(第8-18行),首先给定当前固定的参数θ和φ,MetaSelector首先迭代支持集DuS以在基本模型上生成每项分布λ(第9行)然后得到最终预测p(x;θ,φ)是输出M(x;θ)的凸组合(第10行),计算在DuS中的数据点的损失 L D S u ( θ , φ ) \mathcal{L}_{D_{S}^{u}}(\theta, \varphi) LDSu??(θ,φ),对基础模型和模型选择器的参数执行梯度更新步骤,从而得出适用于特定任务的一组新参数θu和φu(第13行),同理使用更新后的基本模型参数和模型选择器(第14-18行),以与计算训练损失类似的方式,在查询集上计算出测试损失 L D S u ( θ , φ ) \mathcal{L}_{D_{S}^{u}}(\theta, \varphi) LDSu??(θ,φ) 需要注意的是:内循环的路径从(θ,φ)到(θu,φu),可以将测试损失LDQu(θu,φu)表示为θ和φ的函数,并传递到外循环以更新θ和φ Jointly Meta-training θ and φθ和φ在外部循环(第20行)中一起更新,分别用作基础模型和模型选择器的初始化,更新参数以适应每个用户(第13行)。元训练的目标可以表示为: min ? θ , φ E u ∈ U [ L D Q u ( ( θ , φ ) ? α ? θ , φ L D S u ( θ , φ ) ) ] \min _{\theta, \varphi} \mathbb{E}_{u \in U}\left[\mathcal{L}_{D_{Q}^{u}}\left((\theta, \varphi)-\alpha \nabla_{\theta, \varphi} \mathcal{L}_{D_{S}^{u}}(\theta, \varphi)\right)\right] θ,φmin?Eu∈U?[LDQu??((θ,φ)?α?θ,φ?LDSu??(θ,φ))] Learning Inner Learning Rate α内部学习率α在正常模型训练过程中通常是一个超参数,也可以通过将损失函数也视为α的函数,在元学习方法中进行学习。结果表明,每组参数学习的内部学习率α(与θ长度相同的向量)相对于MAML在回归和图像分类方面取得了一致的提高。 可以对算法1进行相应的修改:在第13行中,内部更新步骤变为:
(
θ
u
,
φ
u
)
←
(
θ
,
φ
)
?
α
°
?
θ
,
φ
L
D
S
u
(
θ
,
φ
)
\left(\theta^{u}, \varphi^{u}\right) \leftarrow(\theta, \varphi)-\alpha \circ \nabla_{\theta, \varphi} \mathcal{L}_{D_{S}^{u}}(\theta, \varphi)
(θu,φu)←(θ,φ)?α°?θ,φ?LDSu??(θ,φ) Simplifying论文为MetaSelector提出了元训练的简化版本,其中不需要针对基本模型进行任务内调整。基本模型在元训练之前被预先训练,然后被固定,只训练模型选择器。 Experiment数据集
baseline单一模型:LR、FM、DeepFM 评价指标 & 实验结果除了AUC和logloss,文章使用 RelaImpr 作为评价指标,来衡量模型的相对提升情况,对于随机的情况auc为0.5,所以可以得到RelaImpr的公式: 为了探索模型选择方法的潜力和局限性,我们通过两个完美的模型选择器来计算上限,(1)完美样本级选择器,为每个样本选择最佳模型;(2)完美用户级选择器,为每个用户选择最佳模型。 为什么MetaSelector效果比较好?换句话说,MetaSelector在哪些方面帮助了模型选择? Conclusions这篇文章主要是利用MAML的思想对推荐系统中模型选择场景进行建模,一种新颖的框架MetaSelector,该框架引入了元学习,从而在涉及两个或多个推荐模型的混合推荐系统中制定了用户级模型选择模块。 这个思路值得我们借鉴,将现有的方法来解决目前所遇到的问题,也是一种别样的创新,因此拓宽知识面还是很有必要,大家一起共勉,跟着小曾哥,带你们一起沉淀,充电! |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 4:39:14- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |