| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 知识图谱论文阅读(十五)【arxiv】A Survey on Knowledge Graph-Based Recommender Systems -> 正文阅读 |
|
[人工智能]知识图谱论文阅读(十五)【arxiv】A Survey on Knowledge Graph-Based Recommender Systems |
想法论文摘要难点: 1. Introductionrecommender systems分为三类:1. CF 2. Content-based recommender systems 3. hybrid recommender ; KG-based recommender systems可以分为三种: Embedding-based method、path-based method和unified method。 KG是一个异构图,包含了更多的side information,比如用户的社会关系、item属性等。
2. Related work(和introduction是一样的)2.1 Knowledge Graphs描述KG的常用方法就是使用RDF(Resource Description Framework)! 像Google’s Knowledge Graph和Satori都被嵌入到了搜索引擎,前者是Google的,后者是Bing的; CN-DBPedia是复旦大学出的,是目前中文最大的一个! 2.2 Recommender Systems推荐系统就是给定user u和item i,最后来个得分函数,查看该item值不值得推送! 所以主要目标就是学习user、item的表示以及得分函数的选择。 到目前为止有三种方式: Content-based Filtering: 这里我们是学习user和item的特征表示的,其中user的特征表示是由其历史交互信息(items)得到的,而item更多是其属性。 所以Content-based Filtering更多是推荐一些过去的相似的items! Hybrid Method: 3 OVERVIEW我们首先给出文中使用的符号和概念,以消除误解。 Heterogeneous Information: V和E是实体和链接; 而A和R是实体类型和链接类型 Knowledge Graph (KG): RDF Meta-path: 用来提取图中的连接性特征,用在HIN!A是实体类型,R是关系类型! Meta-graph 是meta-path的多种组合版! 更有结构性 知识图嵌入(KGE) User Feedback 如果是1,那么就表示有隐式的交互! 但是隐式的交互不一定就是对该东西有好感,除非有特殊的说明。 有些情况下这种显示反馈能表达用户的喜好,比如电影的评分很高或者低! H-hop邻居: 相关的实体: 其中是用户的历史交互项的集合。 User Ripple Set: Entity Ripple Set: 4 Methods of recommender systems with knowledge graphs怎么使用KG可以被分成三部分:embedding-based methods, path-based methods, and unified methods. 4.1 Embedding-based Methods基于嵌入的方法一般是直接利用KG中的信息来丰富物品或用户的表示。为了挖掘KG信息,需要应用知识图嵌入(KGE)算法将KG编码为低秩嵌入。KGE算法可分为两类[98]:翻译距离模型,如TransE[99]、TransH[100]、TransR[101]、TransD[102]等,语义匹配模型,如DistMult[103]。 而基于嵌入的方法又可以分为两种: 有user的KGs和无user的KGs! 4.1.1 无User的KGs无User的KGs:KGs中只有items,该items graph可以从数据集或者外部知识众包中获得! 之后通过KGE丰富每个item的内容得到一个低维向量,最后融合到我们的推荐系统中。 总体而言,通过多种来源的特征的融合我们得到item和user的最终向量 V j V_j Vj?和 U i U_i Ui?,之后我们通过一个函数得到 u i u_i ui?对 v j v_j vj?的选择概率: 其中 f ( ? ) f(·) f(?)可以是inner product,DNN,etc,最后我们通过得分来进行Top-N推荐。 举例: CKE模型,该模型中一个item V j V_j Vj?的向量由各种向量aggregated而成: 其中,第一项从user-item交互矩阵中提取; 第二项是item的在KGs中通过TransR得到的结构向量,第三项是文本特征(text),第四项是视觉特征(visiable) 在获得user U i U_i Ui?的潜在向量后,最终的喜好分数 y ^ i , j \hat{y}_{i,j} y^?i,j?通过inner product得到 u i T v j u_i^Tv_j uiT?vj?,之后我们通过分数来给用户推荐物品。 DKN模型, 同样是如何获得item 和 user的特征表示。 在该模型中, 其中 V j V_j Vj?就是我们前面求出的候选新闻的特征; g ( ? ) g(·) g(?)是DNN层。 最后的user embedding u i u_i ui?通过点击新闻的嵌入的权重和得到: 最后,我们再通过前面的公式得到对该候选新闻的兴趣,这里 f ( ? ) f(·) f(?)是DNN层 KSR模型: XXXXX有个图 4.1.2 User-item graph其它的方法中则是构建异构图,也就是建立user-item graph,其中users、items和他们相关的属性函数作为结点,其中attribute-level relation(牌子、类别,etc)和user-related relations(co-buy,co-view,etc)都作为边。 既然有了图,那么就可以获得KG中实体的嵌入,那么user i和item j的embedding也可以获得,既可以直接通过公式一得到结果! 也可以添加relation得到分数: CFKG模型: 这里也是创建一个user-item graph,其中user behaviors(purchase、mention)会被认为是 一种关系类型; 而item side information的多种类型(比如review,brand, category,bought-together,etc)也都包含在里面; 为了学习图中的关系和实体的embedding,模型中定义了一个metric function d ( ? ) d(·) d(?)来测量给定关系下两个实体的距离。 最后在推荐阶段,也是通过距离的上升顺序来进行推荐。 其中 r b u y r_{buy} rbuy?是’buy’关系 SHINE模型: 将名人推荐任务(社交网络中对某个明星的喜爱)作为图中实体之间的情感链接推荐任务,在该模型中将users和targets(名人)都嵌入到情感网络 G s G_s Gs?中,并利用了他们的社会关系 G r G_r Gr?和档案信息网络 G p G_p Gp?作为辅助信息,这三个网络被auto-encoder 技术embedded了(分析,形成向量),之后aggregate后作为user和target的向量,最后使用公式一判断兴趣点; 其中 f ( ? ) f(·) f(?)是一个DNN层。 DKFM模型:POI推荐,在一个city KG上使用TransE丰富了目的地的特征表示,提高了POI效果。 原来的工作只是使用经过KGE后的raw vector,现在更多的工作在refine 得到的实体的和关系的raw vector: KTGAN:A GAN-based model。 第一阶段, 获取初始user 和 movie的latent vector! 其中对于movie v j v_j vj?,其潜在向量可以这样得到: V j i n i t i a l = V j k ⊕ V j t V_j^{initial} = V_j^{k} \oplus V_j^{t} Vjinitial?=Vjk?⊕Vjt? 其中 V j k V_j^{k} Vjk?通过在movie’s KG进行 Metapath2Vec model得到的; 而 V j t V_j^{t} Vjt?则是通过在movie’s attributes上进行Word2Vec model得到的; 同理,用户
u
i
u_i
ui?的潜在向量可以这样得到: 其中 U j k U_j^{k} Ujk?是 u i u_i ui?的最喜欢的电影的知识嵌入的平均; 而 U j t U_j^{t} Ujt?是 u i u_i ui?的tag 嵌入。 第二步: 生成器G和辨别器D被引入来更好的更新user和item的初始向量表示,生成器通过得分函数 p θ ( v j ∣ u i , r ) p_{\theta}(v_{j}\mid u_i,r) pθ?(vj?∣ui?,r)为用户 u i u_i ui?产生相关(最喜欢)的电影,其中r代表了 u i u_i ui?和 v j v_j vj?的相关性。 在测试阶段,G尝试让 p θ ( v j ∣ u i , r ) p_{\theta}(v_{j}\mid u_i,r) pθ?(vj?∣ui?,r)近似于其最喜欢的电影分布 p t r u e ( v j ∣ u i , r ) p_{true}(v_{j}\mid u_i,r) ptrue?(vj?∣ui?,r),以便G可以选择相关的用户电影对。 D是一个二分类器用来区分相关的user-movie对和不相关的user-movie对根据得分函数 f ? ( u i , v j ) f_\phi (u_i, v_j) f??(ui?,vj?)拍判断。 损失函数如下: 其中, 表示电影
v
j
v_j
vj?被用户
u
i
u_i
ui?喜欢的概率。 在对抗训练结束后,就可以得到 BEM模型: 这里使用了为items准备的两种类型的图, knowledge-related graph(item attributes、brand、category,etc)和behavior graph(interaction-related information, co-buy,co-add,co-rate to cart); 首先,BEM会首先学习初始embedding,其是将TransE和GNN-based model分别应用到上面两个图得到到的! 之后呢,BEM使用一个贝叶斯框架来refine这两种embedding。推荐可以通过在行为图中找到最接近交互项目的项目来生成,这是通过“共同购买”或“共同点击”的关系来衡量的。 4.1.3 multi-task之后的趋势则是multi-task学习的策略,共同在KG-related task的引导下学习推荐任务。 第一个任务就是推荐任务,推荐任务就是寻找一个函数 f ( ? ) f(·) f(?),该函数可以预测user i 对 未知item j的兴趣分; 而KG-related task则是学习另一个函数 g ( e h , r , e t ) g(e_h, r, e_t) g(eh?,r,et?)来决定 ( e h , r , e t ) \left (e_h, r, e_t \right ) (eh?,r,et?)在KG中是一个有效的三元组。 这样两部分结合就是目标函数: 其中前者是推荐的loss 函数,后者是KG-related task的loss函数, λ \lambda λ是平衡参数。 多任务学习的动机是,推荐模块中的item embeddings和KG中的关联实体嵌入由相同的特征。 KTUP模型: 也是multi-task,共同学习推荐和知识图谱任务。 推荐模块的损失函数: 其中
(
u
,
v
)
(u, v)
(u,v)是被观察到的user-item对,而
(
u
,
v
′
)
(u, v^{'})
(u,v′)是未被观察到的user-item对;
p
p
p代表了user对给定item的喜好程度;
f
(
?
)
f(·)
f(?)是所提出的translation-based model,TUP,建模一个user-item对的正确性; 其中 G ? \mathcal{G}^- G?是替换了 G \mathcal{G} G中的 e h e_h eh?和 e t e_t et?; g ( ? ) g(·) g(?)是一个TransH模型,一个更低的 g ( e h , r , e t ) g(e_h, r, e_t) g(eh?,r,et?)值推断出这样一个三元组的更高正确性; [ ? ] = m a x ( 0 , ? ) \left [ \cdot \right ] = max\left ( 0, \cdot \right ) [?]=max(0,?); γ \gamma γ是一个margin参数; 推荐模块是为挖掘user i对item j的偏好关系,而Knowledge completion task则是提取KG中items之间的关系; 而两者的桥梁就是他们在KG有相对应的实体。两者之间互相传递只是可以丰富item和preference的embedding! MKR模型:也包含了一个推荐模块和一个KGE模块。前者学习users和items的潜在表示,后者则使用语义匹配KGE模型学习关联实体的item! 这两部分通过一个cross&compress单元来传递知识! RCF模型:它引入了item的层次描述,包括关系类型嵌入和关系值嵌入。RCF利用DistMult模型作为KGE来保留items之间的关系结构! 然后后,利用注意机制分别对用户的类型级偏好和价值级偏好进行建模。通过推荐模块和KG关系建模模块的联合训练,可以做出像样的推荐。 总结: 4.2 Path-based MethodsPath-based methods建立了一个user-item图,并利用图中实体之间的连接模式进行推荐,同时这种方式也被称为recommendation in HIN。 这里的连接模式指的是users/items之间的连接相似性(也就是相似性高,则user/items之间或者之内相似性高)。 图中实体之间的连接相似性可以通过PathSim来度量: 其中 P m → n P_{m\to n} Pm→n?是实体m和n的一条路径。 一种基于路径的方法利用不同元路径中实体的语义相似性作为图的正则化,以细化HIN中user和item的表示。 之后就可以通过公式一来预测user i对item j的喜好程度,这里 f ( ? ) f(·) f(?)是内积。
这里的 ∥ ? ∥ F \left \| \cdot \right \| _F ∥?∥F?表明是matrix Frobenius norm; Θ = [ θ 1 , θ 2 , ? ? , θ L ] \Theta = \left [ \theta _{1},\theta _{2},\cdots ,\theta _{L} \right ] Θ=[θ1?,θ2?,?,θL?]表明了每个meta-path的权重, U = [ u 1 , u 2 , … , u m ] \mathrm {U}=[\mathrm{u}_1,\mathrm{u}_2,\dots ,\mathrm{u}_m] U=[u1?,u2?,…,um?]表明了所有用户的潜在向量; s i , j l s_{i,j}^l si,jl?表明用户i和j在meta-path l l l的相似性分数; 这个相似度会迫使两个在元路径上相似的用户的潜在向量更近接近。
V = [ v 1 , v 2 , … , v n ] \mathrm {V}=[\mathrm{v}_1,\mathrm{v}_2,\dots ,\mathrm{v}_n] V=[v1?,v2?,…,vn?]表明所有item的潜在向量.同上,如果基于元路径的相似度很高,那么物品的low-rank表示应该是接近的。 User-Item Similarity:目标函数: 如果用户和物品的元路径相似度较高,则用户和物品的潜在向量会变得更接近。 Hete-MF:提取出了L条不同的meta-path并且在每条path中计算item-item之间的相似性; item-item正则化与加权非负矩阵分解方法相结合,细化用户和项目的low-rank表示,以便更好地推荐。Hete-CF:把user-user相似性,item-item相似性和user-item相似性聚在一起作为正则化项来找到用户对其为评分的item的亲和力。 因此,后者优于前者。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 16:46:41- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |