IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 推荐系统——Deep Session Interest Network for Click-Through Rate Prediction(DSIN) -> 正文阅读

[人工智能]推荐系统——Deep Session Interest Network for Click-Through Rate Prediction(DSIN)

前言

论文地址:arxiv
代码地址:github
代码为第三方复现的,仅供参考,可能会有diff建议阅读原文…

动机

做ctr预测的时候,观察数据集可以很明显的发现每个用户都会有短时兴趣和长时兴趣,我认为长时兴趣可以表征一个用户丰富的个性化特征,短时兴趣可以更加准确的反应用户当前关注的领域。也确实有论文依据这个想法设计的模型,见:Arxiv-SIM。本文作者主要关注在如何使用短时的兴趣来更好的预测用户的点击。

网络结构

z
完整的结果如上图所示,可以说基本上参考DIN和DIEN,不了解这两篇论文的可以跳转:DIENDIN。多了什么结构呢,接下来一一拆解。
在这里插入图片描述
上图的话输入的Sequence特征,转成了Sessions特征,这就是之前说的短时间兴趣的建模,实现其实很简单,作者就是利用Sequence特征的时间将N个Sequence分了T个类,根据作者论文的描述,分类的时间间隔是每半个小时划分为一类。
在这里插入图片描述
分类之后,作者给Q里面的特征加上位置编码,这个位置编码我感觉论文的公式有问题吧。。。先看原文:
在这里插入图片描述
作者写的BE等于三个w相加。然后这三个w的纬度分别是K,T,C,这怎么加???属实不是很理解作者的意思…参考ViT的话我估计这个BE是一个可学习的参数,一般用torch.Parameter实现,形状是(K,T,d),然后直接和输入相加即可。也就是Q = Q + BE。
在这里插入图片描述
加上之后呢,送入Self Attention模块,这个是attention的经典结构了,不了解的可以参考我之前记录的transformer的论文看看:vision transformer这样就可以得到b1对应的I1,和b2对应的I2了…
然后注意一下,Ik里面因为时间划分会有不定长个特征,因为半个小时时间划分,0点到0:30可能有5个特征,0:30到1:00可能有8个特征,所以需要做一个avg pooling就可以得到最终的Ik了。这个Ik就表示了用户在时间区间k里面的兴趣。
在这里插入图片描述
然后上图就是用k时间区间的特征和item特征计算attention,这个attention就是DIN里面一样的结构,可以参考我之前的解读:DIN,相当于计算某个时刻的兴趣对item的重要程度然后对k个时刻的兴趣做加权求和。
在这里插入图片描述
上图的话就是用Bi-LSTM建模多个时刻兴趣的演变过程,接着计算某个时刻的兴趣对item的重要程度然后对k个时刻的兴趣做加权求和。
在这里插入图片描述
最后就是把三个模块输出的特征拼接起来,过几层FC之后计算损失预测CTR了。

效果

在这里插入图片描述
对比DIN外加了一个self-attention层和BiLSTM层,看着比DIN涨了一个点,但是结构比DIN复杂多了,所以有没有必要呢也不好说了…

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-06 23:10:15  更:2022-04-06 23:13:44 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 11:39:18-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码