| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> SIGIR 2022 一致表征空间下的会话推荐系统 -> 正文阅读 |
|
[人工智能]SIGIR 2022 一致表征空间下的会话推荐系统 |
论文链接:https://arxiv.org/pdf/2204.11067v1.pdf SIGIR 2022?维持于同一表征空间下的会话推荐 ?本文在session-based recommendation领域解决了一个痛点问题,即在同一batch下,每个session的长度恒定,如diginetica数据集下长度都为50,可是session平均的长度却不到5。因此有大量的空白被0填充,在转为session embedding vector的时候没有相应变成了0。 这一个问题还是比较明显的,在我刚开始做sequential recommendation这一块时,发现了每个user的embedding vector有一部分是完全相同,我还怀疑过embedding不会被训练,hhh。 总而言之,赵鑫老师组的这篇对我挺有启发意义的。未来可以试着做一些对抗攻防,因为session领域训练依靠的知识还是比较少的。假如我在item embedding中加入点噪声,那么我猜就直接干掉这个模型了。(这是可以说的吗) 1?导读 Session-based recommendation指的是用户在匿名情况下根据短期的点击序列来预测下一次点击的推荐系统。然而,非线性encoder学习得到的每一session的embedding vector是和item的embedding vector不在同一表征空间,因而导致结果不正确。因此,本篇文章设计了CORE框架,将item embedding线性组合作为session的embedding,并且提出一种鲁棒距离测定方法,防止过拟合。 2?方法首先,每个商品映射到统一embedding空间,hi=Emb(vi)∈Rd表示商品vi的embedding;然后,通过编码器Encoder编码序列中的商品embedding得到会话embeddinghs=Enconder([hs,1,...,hs,n])∈Rd;最后预测下一个商品y^=Decoder(hs)∈Rm,其中m为商品数。 ? 2.1?表征一致编码本节目的是将会话编码到商品embedding空间中,缓解会话和商品表征不一致问题。由于大多数现有编码器采用直接堆叠在输入商品embedding上的非线性编码器(例如,RNN?或?Transformer),因此编码的会话embedding与商品不在同一表征空间中。一个自然的想法是是否可以移除商品embedding上的非线性激活函数,并将会话编码为商品embedding的线性组合。 本节提出了一个表征一致的编码器(RCE),它的输出会话embedding是会话中商品embedding的加权总结。线性组合保证会话embedding总是与商品在相同的embedding空间中。使用深度神经网络来学习会话embedding中的每个商品的权重,公式如下
? 此处的DNN()可以采用以下两种方式 2.1.1?通过平均池化学习权重采用平均池化层作为?DNN,即 这种方式忽略会话中商品的顺序,以及每个商品的重要性。 ? 2.1.2?通过Transformer学习权重
像SASRec一样,使用L层自注意力块作为DNNs,表示如下,其中 F∈Rn×d′,d′是最后一层自注意块的前馈网络的输出维度。然后可以得到归一化的权重α?,w为可学习参数。 2.2?鲁棒的距离度量 会话被编码为商品embedding的线性组合并通过衡量embedding空间中商品的距离进行解码,商品embedding直接参与embedding之间的距离计算,容易导致过拟合。因此,本节提出一种鲁棒的方法来测量统一表征空间中的距离,以防止过拟合。 引理?1.?给定会话embeddinghs和商品embedding{hv|v∈V},当使用点积衡量embedding距离时,优化交叉熵损失与优化边距为2的?( - 1)-tuplet?损失近似成正比[1]。 根据上述引理,可以从三个方面提高距离度量的鲁棒性。
根据以上三点可以设计如下损失函数,其中h'表示经过dropout得到的商品embedding。
3?结果和想法 ? ?本文在session-based recommendation领域解决了一个痛点问题,即在同一batch下,每个session的长度恒定,如diginetica数据集下长度都为50,可是session平均的长度却不到5。因此有大量的空白被0填充,在转为session embedding vector的时候没有相应变成了0。 这一个问题还是比较明显的,在我刚开始做sequential recommendation这一块时,发现了每个user的embedding vector有一部分是完全相同,我还怀疑过embedding不会被训练,hhh。 ? ? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 | -2024/12/28 3:37:04- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |
数据统计 |