| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 知识图谱论文阅读(十七)【WWW2021】DGCN: Diversified Recommendation with Graph Convolutional Networks -> 正文阅读 |
|
[人工智能]知识图谱论文阅读(十七)【WWW2021】DGCN: Diversified Recommendation with Graph Convolutional Networks |
论文题目: DGCN: Diversified Recommendation with Graph Convolutional 想法
创新
摘要动机: 我们: 1 INTRODUCTION我们方法的必要性:
综上,(1)和(2)没有改变生成阶段的顺序,而(3)则是存在实际问题。
我们的方法: PRELIMINARIES2.1 多样性推荐的多样性可以是用户内部级别的,也可以是用户间级别的。 intra-user是单个用户的推荐内容的不相似性; inter-user则是集中于为不同用户提供内容。本论文中,我们目标是提高intra-user的多样性。 本论文中, 我们关注的是多种类别!因此有不同的评判标准:
需要注意的是,在覆盖度和熵值方面,值越大,多样性越强,而基尼系数则相反(越低越好)。 2.2 推荐pipeline推荐系统典型流程包含三个阶段:(1)匹配(2)评分(3)重排名; 匹配阶段的时候,就是海选的时候,得到一大部分items; 评分阶段需要深度学习模型来得到分数,从而几十项items会被选择;重排名中,选择的items会被重新排序来满足额外的约束。 现有的方法往往将多样性约束放到重排序中,这样使得与上游匹配和评分模型无关,系统则效果不好;其次,匹配模型不知道多样性的信号使得信息本来就是冗余的。 2.3 Accuracy-Diversity dilemma准确率和多样性往往是反比,比如下图中,随机的、矩阵分解的、神经图CF和需要的多样性算法(MMR、DUM、PFM+α+β 和 DPP),使用了一个真实世界最大的交易数据集TAOBAO 这需要找到一个平衡点! 3 METHOD3.1 Overview首先建立一个user-item图,边代表了行为,同时是一个无向图。
3.2 GCN我们的GCN由一个嵌入层和一堆图卷积层组成,其中每个图卷积层包含一个广播操作和一个聚合操作。 3.2.1 Embedding LayerGCN的输入仅仅是users和items的ID features(也就是说是one-hot ID后学习到的);因此我们有了下面的嵌入查询表: 3.2.2 Graph Convolutional Layer.卷积层包含了一个发送和一个聚合! 聚合方面:
3.2.3 Interaction Modeling.在匹配阶段,由于计算成本和延迟要求,所以内积和L2距离被广泛使用,而且在线服务中,也是很有效果的! 因此可以加快邻居的寻找算法。 因此,我们在图的最后一层卷积层使用user和items的表示,并取它们的内积来估计交互概率。 3.2.4 防止过度拟合我们会以概率p来随机的去掉连续卷积层之间的中间节点嵌入,p是超参数需要学习。 3.3 Rebalanced Neighbor Discovering将百万级别的图直接运行GCN不现实,而分成mini-batch会影响效果。 因此,**邻居取样器(neighbor sampler)**应运而生! 它可以从原始图中采样出子图,同时在图上的归纳学习会被实现,并且已经证明可以在数十亿级别的图上使用。 具体而言,邻居采样器会生成 N o d e F l o w Node Flow NodeFlow,这是一个多层的子图,其中边缘只存在于连续的层中。
因此我们提高了从劣势类别中抽取项目的概率,并限制了从优势类别中抽取项目的数量。强调了类别多样化, 重新平衡的邻居发现算法如算法1和算法2所示,由于篇幅的限制,我们省略了GetNeighbors和SampleWithProbability的详细说明,这只是在邻接类别和给出分布的随机选项的简单的查找操作。 在一个user node,我们首先生成item类别的直方图,然后取直方图的逆来增加劣势邻居的比例。 同时,一个平衡参数α会控制bias; 对于一个item node,我们平等对待与它相连的每一个user,并均匀地抽样它的邻居。 这样就会增加了多样性。 3.4 Category-Boosted Negative Sampling从字面上就能理解个大概,就是将上面的取样概率引入到负样本取样。 当前匹配的主要挑战也被称为是隐式反馈。 隐式反馈的意思是说:负样本并不一定意味着用户真正不喜欢的! 因此探索用户的隐式反馈也是一大挑战。在实际中,消极实例是通过从那些没有交互过的items中随机抽样的。 在训练时,正样本和一定数量的负样本配对(负样本率),通过pointwise或者pairwise损失函数来优化,使得正向items与user更接近,而消极items和user越远。 很多工作在致力于negative sampler的设计,在本论文中,我们提出选择similar but negative items, 也就是与阳性样本类别相同的item。通过从positive category中抽取负面items,推荐系统将会在一个类别中区分用户的偏好。 这样会使得推荐系统在同一类别中有更强大的区分能力,使得推荐系统会多考虑多种类别的items(就是说只有top-50,现在同一类别中冗余的少了,那么腾出位置给不同类别的了!) 3.5 Adversarial Learning模型训练阶段! 大多数推荐模型都是单一的准确率目标,忽略了推荐的多样性。 在只有一个准确率优化对象的情况下,用户的类别偏好是通过用户的物品偏好隐式学习的。以第2节中的相同例子为例,推荐系统可能会了解到用户对整个类别(即电子设备)的兴趣,但无法区分用户对不同电子设备的具体偏好(也就是说上面没有同类消极样本)。 所以不提取隐含的类别偏好会导致推荐更过积极类别的items! 受生成模型研究进展的启发,我们建议增加items类别分类的竞争性任务,以达到精馏的目的,进一步增强多样性。具体上说,我们将推荐模型当作生成器,同时增加了一个分类器用来预测该item的类别。 而推荐系统要尽力如fool分类器。 我们的实验中,采用全连接层作为分类器,并使用交叉熵损失进行优化。 在推荐方法,采用log loss。 在实现方面,反向传播过程中插入梯度反转层(GRL)可以很好的完成对抗学习,在领域自适应网络(GAN)中首次引入。 同时我们期望分类器最小化
L
c
L_c
Lc?,迫使GCN最大化
L
c
L_c
Lc?。 我们在从GCN中嵌入的item学习和完全连接的分类器之间插入一个GRL(两个D之间)。在反向传播过程中,最小化分类损失的梯度通过分类器反向流动,并经过GRL。梯度将被逆转(加负号),进一步流向GCN,即对于损失
L
c
L_c
Lc?,分类器的参数进行梯度下降,对GCN的参数进行梯度上升。 对于
L
r
L_r
Lr?,梯度下降会被应用到GCN。 4. Experiment在本节中,我们通过实验回答以下研究问题: 数据集:Taobao、Beibei、MSD、 4.2 Overall Performance (RQ1)
4.3 Study on DGCN (RQ2)在本节中,我们对我们在DGCN中提出的每个组件进行消融研究。我们比较了我们所提出的方法在重新平衡邻居发现、类别增强负抽样和对抗学习方面的性能。 在不丢失GCN优越性能的前提下,我们提出的DGCN在GCN的基础上,采用了三种特殊的多样化设计,大大提高了多样性,同时也保证了推荐项目的相关性 4.4 Trade-off between Accuracy and Diversity(RQ3)在提出的框架中,我们引入两个超参数α和β,以控制重平衡邻居发现和类别增强负抽样的强度。我们现在研究这两个超参数是否可以用于在准确性和多样性之间进行权衡。
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 15:50:44- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |