| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 2021-08-23 -> 正文阅读 |
|
[人工智能]2021-08-23 |
Rech7推荐系统的rank 模块简单介绍? 本文是对七月在线推荐课程rank模块入门介绍的一个简单笔记,本文围绕rank基本总述、ctr预估、FM案例、GBDT+LR、Wide&Deep展开。? 目录 推荐系统的rank 模块简单总述通常做法: 用各种算法做 召回,比如user/item/model-based CF 等作为输入,做粗排(有的没有) 之后交由后面的rank层结合更精细的side_info 做排序,最终展现TopK item给用户。 rank 算法典型应用? ctr 预估、cvr 预估 、watch time 预估、learning to? rank? ? ? todo 待请教? 多目标排序 rank 算法应用示意图 ? candidate? 召回模块? DB :数据 索引 PS:? parameter server? 模型服务部分 rank 的基本流程:? 典型的机器学习流程? ?ctr 预估:?ctr预估的是一个二分类问题。 ? 二分类问题 ????????算法核心 ? Loss = -y log(p) - (1 - y) log(1 - p)? (交叉熵损失)? ?? 评估:? ????????? offline: AUC/MAPE/gauc ????????? online: 业务指标(如点击率,停留时长等)? 最基本的算法 LR? ? 从统计机器学习的角度 ? 特征向量: 𝑋𝑖? ? Label:𝑦𝑖 ? ?经典问题:为什么L1比L2有更强的稀疏性? 参考:?https://www.zhihu.com/question/37096933? , 这个待细查。 视频大概28-20min? ?FM的例子FM(Factorization Machine)? ? 参考:?FM(FactorizationMachine)是由Konstanz大学SteffenRendle(现任职于Google)于2010年最早提出 的,旨在解决稀疏数据下的特征组合问题? ? 解释 ? 直观上看,FM的复杂度是O(kn2)。 tensorflow 里实现FM? :?https://github.com/challenge-ICME2019-Bytedance/Bytedance_ICME_challenge/blob/master/model_zoo/fm.py FFM 引入隐向量:?通过引入field的概念,FFM把相同性质的特征归于同一个field。? FFM中,每一维特征xi,针对其它特征的每一种fj,都会学习一个隐向量𝑣𝑖,𝑓𝑗。因此,隐向量不仅与特征?相关,也与field相关。也就是说,“Day=26/11/15”这个特征与“Country”特征和“Ad_type”特征进行关 联的时候使用不同的隐向量,这与“Country”和“Ad_type”的内在差异相符,也是FFM中“field-aware” 的由来。? OpenMP (工程实现里封装里的trick) OpenMP是由一组计算机硬件和软件供应商联合定义的应用程序接口(API)。OpenMP为基于共享内存 的并行程序的开发人员提供了一种便携式和可扩展的编程模型,其API支持各种架构上的C/C++和 Fortran。? 加上一句去调用openmp来实现对程序的并行计算,? SSE 指令集优化? (了解即可) 特征工程? :? 人工特征工程+ 线性模型? GBDT + LR (Facebook)? 的论文( 筛选特征时的做法,来自论文)? ? 深度学习的应用 ?Wide & Deep(Google)? ? ? ? ? 优化器选择:wide 部分用的优化器 : :FTRLwithL1-regularization (先简单记住)? deep部分的用的优化器是:? AdaGrad? .? 各种优化器之间的区别 todo 待进一步阅读 : https://zhuanlan.zhihu.com/p/40344593? 深度学习排序算法发展图:? ? ? https://github.com/shenweichen/DeepCTR ? https://zhuanlan.zhihu.com/p/53231955? DLRM(Facebook)? DeepLearningRecommendationModelforPersonalizationandRecommendationSystems? Previous Core Techniques : 过去的核心技能 ? ? Embeddings?
字节跳动短视频内容理解与推荐竞赛 https://github.com/challenge-ICME2019-Bytedance/Bytedance_ICME_challenge? 这个已经过期 master/model_zoo/fm.py 的实现 ? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 18:49:06- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |