IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 数据结构与算法 -> 【推荐系统】逻辑回归(LR)在推荐系统中的使用 -> 正文阅读

[数据结构与算法]【推荐系统】逻辑回归(LR)在推荐系统中的使用

背景

相比于传统的协同过滤,矩阵分解算法,在推荐系统中逻辑回归(Logistic Regression ,LR)模型能够综合用户信息、物品、上下文等多种不同的特征,效果也会更好。我们知道逻辑回归是一个分类模型,那么自然而然地会将推荐系统问题进行相关的转换,分类过程中会对目标类别有一个打分,然后根据打分结果进行排序得到推荐的结果。选用的正样本可以是用户“点击”的某个商品,用户“观看”的某个视频等等。这时就出现了我们经常见到的名词:点击率(Click Through Rate, CTR)预估。下面就来看看如何结合用户相关信息数据和逻辑回归进行推荐吧。

基于LR的推荐系统

推荐流程概述

使用LR进行推荐的主要流程如下:

  1. 数据预处理:包含用户的一些信息,如年龄,性别数据,物品的属性、描述数据,以及当前的场景:时间,地点等数据转换成模型可计算的数值类型特征向量;
  2. 确定逻辑回归的优化目标,例如:优化CTR;
  3. 利用已有的样本数据进行LR训练,保存模型;
  4. 模型上线服务:将用户的特征数据、商品数据、场景数据根据步骤1的方式处理成特征向量,得到目标(如点击率)相关概率值;
  5. 对各商品的概率值进行排序,得到推荐列表。

整体流程比较清晰,核心的就是数据预处理以及模型训练了。

LR在推荐中的应用

假设模型的输入(特征向量)为: x = ( x 1 , x 2 , ? ? , x n ) x =(x_1,x_2,\cdots,x_n) x=(x1?,x2?,?,xn?),其中 n n n表示特征数目。那么对应的权重有 w = ( w 1 , w 2 , ? ? , w n ) w=(w_1, w_2,\cdots,w_n) w=(w1?,w2?,?,wn?),如果选择bais,则有 w = ( w 1 , w 2 , ? ? , w n + 1 ) w=(w_1, w_2,\cdots,w_{n+1}) w=(w1?,w2?,?,wn+1?),其中 x = ( x 1 , x 2 , ? ? , x n + 1 ) x =(x_1,x_2,\cdots,x_{n+1}) x=(x1?,x2?,?,xn+1?) x n + 1 = 1 x_{n+1}=1 xn+1?=1。然后的计算就是: x T w x^Tw xTw

接下来,将 x T w x^Tw xTw的结果输入到sigmoid函数中,就可以得到点击率了,因为sigmoid会将 x T w x^Tw xTw的结果进行归一化,我们认为这个归一化的结果就是点击的概率。其中sigmoid函数如下:
f ( z ) = 1 1 + e ? z f(z) = \frac{1}{1+e^{-z}} f(z)=1+e?z1?
综上来说就是一个公式:
f ( x ) = 1 1 + e ? ( x T w ) f(x) = \frac{1}{1+e^{-(x^Tw)}} f(x)=1+e?(xTw)1?
在推理时就使用上面的操作即可。但是需要对该模型进行训练,以确定最优的权重参数 w w w。常用的就是用梯度下降算法对参数进行更新了。这里就不再赘述。

训练好的模型结合输入特征,对每一个商品进行打分,那么可用选取topK的商品进行推荐。

总结

其实使用LR处理的内容并不多,但是在工业界还是比较有效的。在数学含义上有支撑,可解释性比较强,工程化也相对简单。但是缺点也比较明显:表达能力不强,无法进行特征交叉,特征筛选等等。后来的基于深度学习的推荐系统,其特征表达的能力远超过这些非深度学习模型,效果也更好。

  数据结构与算法 最新文章
【力扣106】 从中序与后续遍历序列构造二叉
leetcode 322 零钱兑换
哈希的应用:海量数据处理
动态规划|最短Hamilton路径
华为机试_HJ41 称砝码【中等】【menset】【
【C与数据结构】——寒假提高每日练习Day1
基础算法——堆排序
2023王道数据结构线性表--单链表课后习题部
LeetCode 之 反转链表的一部分
【题解】lintcode必刷50题<有效的括号序列
上一篇文章      下一篇文章      查看所有文章
加:2022-04-24 09:40:34  更:2022-04-24 09:43:49 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 8:51:24-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码