IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 【论文笔记】跨域推荐(CDR) -> 正文阅读

[人工智能]【论文笔记】跨域推荐(CDR)

DTCDR(2019)

论文解读系列第一篇:CIKM-19 论文 DTCDR - 知乎 (zhihu.com)

1 核心思想

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-a3F3e4r1-1626967003304)(C:\Users\86525\AppData\Roaming\Typora\typora-user-images\image-20210720160702083.png)]

  • 传统的跨域推荐都是利用源领域(Source domain)的丰富数据来提升单个目标领域(Target domain)的推荐准确度,即Source→Target。而源领域的推荐准确度没法直接通过现有的CDR方法来提升,因为没法直接改变现有的知识迁移方向,即没法从Source→Target变成Target→Source,否则会产生**“消极迁移”(Negative Transfer)的问题**。本论文中以两个域的共同用户或者共同商品作为桥梁,来实现双向的知识迁移,从而同时改善两个领域的推荐准确度。

  • 嵌入层中,本论文除了常用的评分信息以外,还利用了其它多源的文本信息,如评论文本,标签,用户简介,商品详情。该论文使用Doc2Vec模型来处理这些文本信息,获取用户和物品的文本表示(document embedding)。此外,该论文改进了NeuMF和DMF两个模型,并分别获取用户和物品的评分表示(rating embedding)。

  • 合并层中,使用max-pooling策略分别合成共同用户分别来至领域A和B的文本以及评分信息。接着使用三种不同的合并策略(Combination operators,具体的是指average-poolingmax-pooling,以及Concatenation来合成文本以及评分信息。==通过嵌入层和合并层,优化了领域A和B中共同用户的特征表示,并同两个领域分别的物品特征表示一起作为模型层的输入。==在模型层,使用了全连接的多层感知器(MLP)来学习用户和物品之间的非线性关系,并最终得到喜好预测(Score)给输出层。

DDTCDR(WSDM-2020)

DDTCDR: Deep Dual Transfer Cross Domain Recommendation (aisoutu.com)

1 核心思想

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zui1PAVG-1626967003307)(C:\Users\86525\AppData\Roaming\Typora\typora-user-images\image-20210720152547405.png)]

  • 以前提出的跨领域模型没有考虑到用户和项目之间的双向潜在关系。此外,它们不明确地建模用户和商品特征的信息,而仅利用用户评级信息进行推荐。本论文采用隐性嵌入方法,可以从数据记录中提取潜在的用户偏好,并有效地建模用户和项目特征。

  • 作者建议使用两个组件来建模用户偏好:捕获用户交互并预测用户在目标域中的行为的域内偏好和利用源域用户动作的跨域偏好。引入了传递率α作为超参数,它代表了在预测用户偏好时两种成分的相对重要性。在域对(A, B)中估计用户评分如下:

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Fb8nxneE-1626967003308)(C:\Users\86525\AppData\Roaming\Typora\typora-user-images\image-20210720153455663.png)]

  • 利用深度双迁移学习机制实现用户偏好的双向迁移,该算法学习了两个域的潜在正交映射函数,既能保留用户偏好的相似性,又能有效地计算出反向映射函数。

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zJ47lZXt-1626967003310)(C:\Users\86525\AppData\Roaming\Typora\typora-user-images\image-20210720153804309.png)]

GA-DTCDR(IJCAI2020)

1 核心思想

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tqd9T0HL-1626967003311)(C:\Users\86525\AppData\Roaming\Typora\typora-user-images\image-20210720105434730.png)]

  • 此前的最好方法往往只考虑了用户-商品间的联系,而忽略了用户-用户以及商品-商品间的联系。本论文通过构建异构图(heterogeneous graph)考虑了用户-商品间的联系(基于评分),还考虑了用户-用户以及商品-商品间的联系(基于内容相似性),然后通过 graph embedding technique (Node2vec)利用异构图生成相应的 user embedding matrix U 和 item embedding matrix V,这样能够更准确地捕捉到用户和物品的特征。

  • 在融合共同用户/物品的embeddings时,此前的最好方法使用固定的合成策略,比如 average-pooling, max-pooling,,and concatenation本论文使用 element-wise attention networks 替代之前固定的合成策略,通过自注意力机制让机器自动学习到如何从本域的user以及common user中提取特征,也就是利用其他域的user特征来帮助生成本域的user特征。

2 小知识点

ACDN(WWW-2020)

1 核心思想

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-C98z29aQ-1626967003312)(C:\Users\86525\AppData\Roaming\Typora\typora-user-images\image-20210721163634121.png)]

  • 对于衣服鞋子这种仅商品图片就包含了大量信息的商品来说,商品图片的特征是十分重要的。而用户的审美偏好往往是独立于领域的,比如一个喜欢hiphop风格的顾客,在购买衣服,鞋子,项链等商品时往往也会选择更偏向hiphop风格的产品。因此,视觉信息可以在提高外观优先推荐产品的性能方面发挥重要作用本论文通过捕获用户独立于领域的审美偏好,利用新颖的审美特征进行跨领域推荐

  • 使用ILGNet来提取产品图片的局部以及宏观审美特征

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5o4NMdWX-1626967003313)(C:\Users\86525\AppData\Roaming\Typora\typora-user-images\image-20210721164440413.png)]

2 小知识点

最新综述(IJCAI-2021)

论文解读系列第十六篇:IJCAI 2021–跨域推荐(Cross-Domain Recommendation)的最新综述 - 知乎 (zhihu.com)

1 背景介绍

  • 基于协同过滤技术(Collaborative Filtering,CF)(3条消息) 个性化智能推荐(协同过滤算法)技术研究_zolalad的专栏-CSDN博客的推荐系统,都多多少少受到数据稀疏的影响
  • 特别对于新用户或者新产品**(Cold-Start,冷启动问题)**来说,由于在系统内还没有产生任何的交互信息(评分、评论等等),推荐的精度会比较低
  • 跨域推荐的提出就是为了解决这个数据稀疏问题。基本思路是利用**丰富领域(richer domain又称为source domain)的较为丰富训练数据来提升稀疏领域(sparser domain又称为target domain)**的推荐精度。
  • 领域(domain)的定义:
    • 内容层级相关性(content-level relevance):两个或多个领域中,用户之间或产品之间存在共同的内容或者特征(例如关键字、标签)。但是这些领域不存在共同的用户或者产品。例如:亚马逊音乐(Amazon music,音乐相关)和奈飞(Netflix,电影相关)。
    • 用户层级相关性(user-level relevance):两个或多个领域中,存在共同用户但是产品层级不同。产品层级的不同又可以细分为属性层级(attribute-level)的不同(即类型相同(例如图书)但是属性不同,例如教科书、小说、自传等等)和类型层级(type-level)的不同(例如图书、电影、音乐、服装等等)。
    • 产品层级相关性(item-level relevance):两个或多个领域中,存在共同产品但是用户不同。例如:MovieLens和奈飞,都是电影相关的系统,存在大量相同的电影,但是用户不同,或者很难识别用户一致性。这种类型在一些文献里又被称为cross-system recommendation(跨系统推荐)。

2 综述动机

  • 近些年来,在跨域推荐领域出现了一些新的或愈发明显的挑战,例如:
    • 特征映射问题
    • 嵌入(embedding)优化问题
    • 负面迁移问题(negative transfer)
  • 随着应用场景的拓展,跨域推荐也出现了一些新的方向:
    • 双目标跨域推荐(dual-target CDR)
    • 多目标跨域推荐(multi-target CDR)

3 不同的跨域推荐场景以及挑战

  • **场景1. 单目标跨域推荐(single-target CDR):**传统的跨域推荐主要是针对的单目标跨域推荐(single-target CDR),即利用丰富领域(源领域,source domain)来提升稀疏领域(目标领域,target domain)的推荐精度。根据上面‘领域’的不同定义,单目标跨域推荐可以细分为以下三个应用场景:

    preview

  • 这个场景下,研究人员将面临如下三个挑战:

    • 构建基于内容的关系

    • 生成准确的用户/产品嵌入表达(embeddings)或者评价模式(rating patterns)

    • 学习准确的映射关系:领域之间embedding或rating pattern的迁移对应关系。

  • **场景2. 多领域推荐(Multi-Domain Recommendation):**在单目标跨域推荐中,有一个研究分支,即多领域推荐(Multi-Domain Recommendation)。这个分支主要针对来之多个领域的特定用户集中用户,推荐来之多个领域的特定产品,本质上这也是single-target CDR,因为推荐的目标是特定一个集合(用户集合)。因此,本综述认为这个研究方向还是single-target CDR的一个分支。

    preview

  • **场景3. 双目标跨域推荐(dual-target CDR):**这是一个新的跨域推荐场景,即同时利用两个领域的数据来同时提升两个领域的推荐精度。这个场景面临以下两个新的挑战:

    • 构建一个可行的双目标跨域推荐的框架

    • 各领域之间的对应关系,优化用户/产品的嵌入表达(embeddings)

  • **场景4. 多目标跨域推荐(Multi-target CDR):**这也是一个新的跨域推荐场景,即同时利用多个领域的数据来同时提升多个领域的推荐精度。这个场景面临以下挑战:

    • 避免负面迁移(negative transfer),这个问题随着越来越多领域的加入会愈加严重。

img

4 相关的研究进展

  • 现有的跨域推荐方法主要划分如下图:

preview

5 可用数据集合

preview

6 未来研究方向

  • 异质化跨域推荐:现有跨域推荐的假设前提是跨域的信息是同质的,但是实际应用场景中,存在跨域的异质信息。
  • 序列化跨域推荐:跨域推荐系统也和传统推荐系统一样,面临如何序列化地给用户/产品建模。
  • 隐私保护的跨域推荐:现有的跨域推荐方法忽略了信息孤岛的问题。而实际应用场景,用户敏感信息是无法直接跨域分享的。
  • 另外,数据集稀疏程度、领域间的重叠规模(overlap scale)、以及领域间的关联度,如何分别影响跨域推荐的性能?这些问题同样也值得进一步研究。

7 结论

近些年,随着深度神经网络以及图学习的发展,跨域推荐越来越受工业界、学术界的关注。本篇综述分别从单目标跨域推荐、多领域推荐、双目标跨域推荐、以及多目标跨域推荐来系统性地分析、总结现有跨域推荐方法。综述的最后,给出了三个未来值得研究方向以供读者参考,并希望这些方向能得到进一步的研究,最终解决困恼推荐领域多年的问题—数据稀疏问题。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-07-23 10:47:03  更:2021-07-23 10:47:40 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年3日历 -2024/3/29 1:17:43-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码