IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 论文《Sequential Recommendation with Graph Neural Networks》阅读 -> 正文阅读

[人工智能]论文《Sequential Recommendation with Graph Neural Networks》阅读

论文概况

本文是2021年SIGIR上的一篇论文,该篇文章通过计算用户在会话中的主要兴趣并计算兴趣聚簇来解决顺序推荐问题

Introduction

作者提出了几个问题

  • 并不是会话中的每个项目都能体现用户的兴趣,会话中夹杂大量噪音.
  • 用户的喜好是迅速变化的,单从历史会话中很难捕获接下来的喜好变化

对于上述问题,作者提出SURGE网络(Sequential Recommendation with Graph Neural Networks):(1)从新角度解决顺序推荐,考虑隐信号行为和快速变化的偏好(2)通过物品-物品兴趣图,使用GNN网络将隐式信号转化为显式信号,设计动态池化来过滤和保留主要偏好以供推荐

Method

在这里插入图片描述

A.Interest Graph Construction

SURGE根据物品之间的相似度来构建兴趣图,一个会话中有n个物品,则有n*n的邻接矩阵,邻接矩阵的数值是按照相似度来计算,这里还使用了多头机制
M i j = cos ? ( w → ⊙ h ? i , w → ⊙ h ? j ) (1) M_{i j}=\cos \left(\overrightarrow{\mathbf{w}} \odot \vec{h}_{i}, \overrightarrow{\mathbf{w}} \odot \vec{h}_{j}\right)\tag{1} Mij?=cos(w h i?,w h j?)(1)
M i j δ = cos ? ( w → δ ⊙ h ? i , w → δ ⊙ h ? j ) , M i j = 1 δ ∑ δ = 1 ? M i j δ (2) M_{i j}^{\delta}=\cos \left(\overrightarrow{\mathbf{w}}_{\delta} \odot \vec{h}_{i}, \overrightarrow{\mathbf{w}}_{\delta} \odot \vec{h}_{j}\right), \quad M_{i j}=\frac{1}{\delta} \sum_{\delta=1}^{\phi} M_{i j}^{\delta}\tag{2} Mijδ?=cos(w δ?h i?,w δ?h j?),Mij?=δ1?δ=1??Mijδ?(2)
此时,邻接矩阵每个位置都有相似度数值,设相似度数值大于某一阈值,则将此处数值设为1,其余为0
A i j = { 1 , M i j > = Rank ? ε n 2 ( M ) 0 , ?otherwise;? (3) A_{i j}=\left\{\begin{array}{ll} 1, & M_{i j}>=\operatorname{Rank}_{\varepsilon n^{2}}(M) \\ 0, & \text { otherwise; } \end{array}\right.\tag{3} Aij?={1,0,?Mij?>=Rankεn2?(M)?otherwise;??(3)

B. Interest-fusion Graph Convolutional Layer

通过兴趣图来计算每个节点的向量表征,aggregate可以是Mean,Sum, Max, GRU,这里使用Sum,并且同样利用多头机制
h ? i ′ = σ ( W a ? ?Aggregate? ( E i j ? h ? j ∣ j ∈ N i ) + h ? i ) .? (4) \vec{h}_{i}^{\prime}=\sigma\left(\mathbf{W}_{\mathbf{a}} \cdot \text { Aggregate }\left(E_{i j} * \vec{h}_{j} \mid j \in \mathcal{N}_{i}\right)+\vec{h}_{i}\right) \text {. }\tag{4} h i?=σ(Wa???Aggregate?(Eij??h j?jNi?)+h i?).?(4)
h i ′ → = ∥ δ = 1 ? σ ( W a δ ? ?Aggregate? ( E i j δ ? h ? j ∣ j ∈ N i ) + h ? i ) , (5) \overrightarrow{h_{i}^{\prime}}=\|_{\delta=1}^{\phi} \sigma\left(\mathbf{W}_{\mathbf{a}}^{\delta} \cdot \text { Aggregate }\left(E_{i j}^{\delta} * \vec{h}_{j} \mid j \in \mathcal{N}_{i}\right)+\vec{h}_{i}\right),\tag{5} hi? ?=δ=1??σ(Waδ???Aggregate?(Eijδ??h j?jNi?)+h i?),(5)
之后是 E i j E_{i j} Eij?计算,包含聚簇注意力和查询感知注意力
聚簇注意力代表当前节点与邻居节点的相似度, h ? i c \vec{h}_{i_{c}} h ic??是k-hop内的邻居向量的平均值
α i = ?Attention? c ( W c h ? i ∥ h ? i c ∥ W c h ? i ⊙ h ? i c ) (6) \alpha_{i}=\text { Attention }_{c}\left(\mathbf{W}_{\mathbf{c}} \vec{h}_{i}\left\|\vec{h}_{i_{c}}\right\| \mathbf{W}_{\mathbf{c}} \vec{h}_{i} \odot \vec{h}_{i_{c}}\right)\tag{6} αi?=?Attention?c?(Wc?h i??h ic???Wc?h i?h ic??)(6)
查询感知注意力代表邻居节点和目标物品的相似度
β j = ?Attention? q ( W q h ? j ∥ h ? t ∥ W q h ? j ⊙ h ? t ) (7) \beta_{j}=\text { Attention }_{q}\left(\mathbf{W}_{\mathbf{q}} \vec{h}_{j}\left\|\vec{h}_{t}\right\| \mathbf{W}_{\mathbf{q}} \vec{h}_{j} \odot \vec{h}_{t}\right)\tag{7} βj?=?Attention?q?(Wq?h j??h t??Wq?h j?h t?)(7)
最终注意力计算如下:
E i j = softmax ? j ( α i + β j ) = exp ? ( α i + β j ) ∑ k ∈ N i exp ? ( α i + β k ) (8) E_{i j}=\operatorname{softmax}_{j}\left(\alpha_{i}+\beta_{j}\right)=\frac{\exp \left(\alpha_{i}+\beta_{j}\right)}{\sum_{k \in \mathcal{N}_{i}} \exp \left(\alpha_{i}+\beta_{k}\right)}\tag{8} Eij?=softmaxj?(αi?+βj?)=kNi??exp(αi?+βk?)exp(αi?+βj?)?(8)

C.Interest-extraction Graph Pooling Layer

我们将n个项目的表征用S矩阵分为m个类, γ \gamma_{} γ?是经过softmax的查询感知注意力.
{ h ? 1 ? , h ? 2 ? , … , h ? m ? } = S T { h ? 1 ′ , h ? 2 ′ , … , h ? n ′ } (9) \left\{\vec{h}_{1}^{*}, \vec{h}_{2}^{*}, \ldots, \vec{h}_{m}^{*}\right\}=S^{T}\left\{\vec{h}_{1}^{\prime}, \vec{h}_{2}^{\prime}, \ldots, \vec{h}_{n}^{\prime}\right\}\tag{9} {h 1??,h 2??,,h m??}=ST{h 1?,h 2?,,h n?}(9)
{ γ 1 ? , γ 2 ? , … , γ m ? } = S T { γ 1 , γ 2 , … , γ n } (10) \left\{\gamma_{1}^{*}, \gamma_{2}^{*}, \ldots, \gamma_{m}^{*}\right\}=S^{T}\left\{\gamma_{1}, \gamma_{2}, \ldots, \gamma_{n}\right\}\tag{10} {γ1??,γ2??,,γm??}=ST{γ1?,γ2?,,γn?}(10)
W p \mathbf{W}_{\mathrm{p}} Wp?对应着m个分类,矩阵S每一行由邻居节点影响
S i : = softmax ? ( W p ? ?Aggregate? ( A i j ? h ? j ′ ∣ j ∈ N i ) ) (11) S_{i:}=\operatorname{softmax}\left(\mathbf{W}_{\mathrm{p}} \cdot \text { Aggregate }\left(A_{i j} * \vec{h}_{j}^{\prime} \mid j \in \mathcal{N}_{i}\right)\right)\tag{11} Si:?=softmax(Wp???Aggregate?(Aij??h j?jNi?))(11)
同时,加入正则项来训练S
为了让相似的两个物品被分到同一类中,设:
L M = ∥ A , S S T ∥ F (12) L_{\mathrm{M}}=\left\|A, S S^{T}\right\|_{F}\tag{12} LM?=?A,SST?F?(12)
S S T S S^{T} SST代表两个点落入同一类的概率,在邻接矩阵中相连的点应被分为同一类
其次使用熵函数使得一个点尽可能只被分到一类中
L A = 1 n ∑ i = 1 n H ( S i : ) (13) L_{\mathrm{A}}=\frac{1}{n} \sum_{i=1}^{n} H\left(S_{i:}\right)\tag{13} LA?=n1?i=1n?H(Si:?)(13)
最后,保证当n个项目变成m个类时,类与类之间的时间关系可以与项目于项目之间的时间关系相同
L P = ∥ P n S , P m ∥ 2 (14) L_{\mathrm{P}}=\left\|P_{n} S, P_{m}\right\|_{2}\tag{14} LP?=Pn?S,Pm?2?(14)

将所有项目的表征乘以分数加和,得到整体的用户兴趣
h ? g = Readout ? ( { γ i ? h ? i ′ , i ∈ G } ) , (15) \vec{h}_{g}=\operatorname{Readout}\left(\left\{\gamma_{i} * \vec{h}_{i}^{\prime}, i \in \mathcal{G}\right\}\right),\tag{15} h g?=Readout({γi??h i?,iG}),(15)

D. Prediction Layer

使用GRU来计算用户接下来可能感兴趣的项目类别
h ? s = AUGRU ? ( { h ? 1 ? , h ? 2 ? , … , h ? m ? } ) (16) \vec{h}_{s}=\operatorname{AUGRU}\left(\left\{\vec{h}_{1}^{*}, \vec{h}_{2}^{*}, \ldots, \vec{h}_{m}^{*}\right\}\right)\tag{16} h s?=AUGRU({h 1??,h 2??,,h m??})(16)
进行用户点击物品预测,将目标项目 用户综合兴趣 用户预测兴趣类别相结合
y ^ = Predict ? ( h ? s ∥ h ? g ∥ h ? t ∥ h ? g ⊙ h ? t ) (17) \hat{y}=\operatorname{Predict}\left(\vec{h}_{s}\left\|\vec{h}_{g}\right\| \vec{h}_{t} \| \vec{h}_{g} \odot \vec{h}_{t}\right)\tag{17} y^?=Predict(h s??h g??h t?h g?h t?)(17)
使用交叉熵和正则项来训练参数
在这里插入图片描述

总结

SURGE使用了独特的兴趣图来进行GNN,同时还将项目聚类,通过RNN预测用户会点击的下一个物品类别,创新点值得借鉴.

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-01-16 13:03:28  更:2022-01-16 13:05:05 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/10 16:52:47-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码