| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> 【王喆-深度学习推荐系统实战】基础架构篇-(task2)Sparrow麻雀推荐系统 -> 正文阅读 |
|
[大数据]【王喆-深度学习推荐系统实战】基础架构篇-(task2)Sparrow麻雀推荐系统 |
学习心得(1)从之前的开篇了解推荐系统要解决的核心问题,生发出深度学习推荐系统的技术,架构篇的学习是从抽象到具体,从形而上到形而下的过程。这个task先把Sparrow推荐系统跑通,一开始IDEA识别maven项目和一些包载入出现问题,最后折腾下解决了:解决IDEA无法识别maven项目和加载包,后面的章节也是围绕这个基础推荐系统详细展开和添加模块。 (2)Sparrow RecSys一共分为三个模块,分别是数据、模型和前端。其中每个部分都用业界推荐系统的主流技术,比如数据部分会用Spark,Flink 进行样本和特征的处理,模型部分会使用 TensorFlow 训练深度神经网络、Wide&Deep、PNN 等模型。 (3)举例:处理数据需要用到 Spark,但不是说一定要成为Spark的专家。因为工作岗位上也有平台架构部的同事能够提供 Spark 的很多技术支持。所以这门课需要抱着一个使用者,而不是开发者、维护者的心态去使用不同的技术平台。如果想成为细分方向(Spark、Flink等领域)专家就需要深入学习。 回顾往期【王喆-深度学习推荐系统实战】开篇词 文章目录一、项目介绍Sparrow Recommender System。像所有经典的推荐系统一样,它具备“相似推荐”“猜你喜欢”等经典的推荐功能,在页面设置上,主要由“首页”“电影详情页”和“为你推荐页”组成。 1.1 数据介绍数据来源:https://grouplens.org/datasets/movielens/ (2)ratings.csv(用户评分数据) 1.2 数据说明:为了方便调试,课程的教学数据集对 MovieLens 数据集进行了精简,只留下了 1000 部电影。如果希望在全量数据集上进行推荐,可以去 MovieLens 的官方网站下载全量数据,它一共包含了 27000 部电影。 MovieLens 的数据集包括三部分,分别是 movies.csv(电影基本信息数据)、ratings.csv(用户评分数据)和 links.csv(外部链接数据)。 (1)Sparrow RecSys 的首页Sparrow RecSys 的首页由不同类型的电影列表组成,当用户首次访问首页时,系统默认以历史用户的平均打分从高到低排序,随着当前用户不断为电影打分,系统会对首页的推荐结果进行个性化的调整,比如电影类型的排名会进行个性化调整,每个类型内部的影片也会进行个性化推荐。 (2) 电影详情页电影详情页除了罗列出电影的一些基本信息,最关键的部分是相似影片的推荐。相似内容推荐是几乎所有推荐系统非常重要的功能,传统的推荐系统基本依赖于基于内容(Content based)的推荐方法,而我们这门课程会更多地讲解基于深度学习 Embedding 的相似内容推荐方法。 (3)为你推荐页(敲黑板)这一部分也是整个推荐系统中最重要的部分,是用户的个性化推荐页面。这个页面会根据用户的点击、评价历史进行个性化推荐。这几乎是所有推荐系统最经典和最主要的应用场景。在这门课程中,需要能够动手完成个性化推荐中的每个关键步骤,包括但不限于特征的处理、候选集的召回、排序层主要模型等等。 二、步骤详解PS:这个跑project出现的问题我记在了另一篇博客:解决:IDEA无法识别maven项目和加载包,和我一样小白的童鞋可以配合食用。
重要注意事项:(1)如果运行scala程序有困难的同学,项目里已经有python实现的版本了,可以把相应的依赖通过pip装完就能运行了,因为project中另外写了个pyspark模块。 三、Sparrow推荐系统的技术图Sparrow Recsys 的技术架构图。其实就是我们用具体的技术选型,把上节课的深度学习推荐系统架构图给填上得到的。所以,Sparrow Recsys 就是深度学习推荐系统架构的一个实现。
四、作业(1)跑通Sparrow Recsys后,对照着上个task的深度学习推荐系统架构图,说出每个模块的代码属于架构图中的哪一部分。
(2)对于一个电影推荐系统来说,什么数据对生成用户个性化推荐结果最有帮助?
四、Reference《深度学习推荐系统实战》——王喆 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/18 10:54:14- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |