| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 客户价值挖掘|基于多类回归模型的探索与预测(附实操)-最适贷中等营销场景 -> 正文阅读 |
|
[人工智能]客户价值挖掘|基于多类回归模型的探索与预测(附实操)-最适贷中等营销场景 |
客户的价值度预测,在金融、电商等领域中是一个典型商业场景,而客户价值度的分析,往往是通过数据建模的方式来进行特征挖掘和评级区分。虽然凭借业务经验在一定程度上也可以对价值客户进行分群,但是真正在实际业务场景中的实现过程,模型是很常见而且特别有效的手段。究其原因,模型可以从多个维度较全面地分析并解释客户的潜在价值。 对客户价值度的预测,从模型类型的角度来看,可以是分类、回归、聚类等问题,各类场景情况举例如下: 本文将围绕客户价值度预测的业务场景,采用回归模型算法来实现场景需求,具体内容通过案例实操进行介绍。对于回归模型,我们将会重点从不同类型的回归算法来训练模型,从而对比分析各种方法的模型性能效果。
根据样本数据,我们采用describe()函数来分析下各特征变量的分布情况,输出的简单统计分析描述结果如图3所示。 由上图可知,样本数据满足回归模型的基本条件,即包含目标Y标签Profit_Value(有监督),且Y变量为连续型(回归)。由于回归模型在训练过程中,特征类型需要以数值型作为输入,因此如果希望特征Education参与到模型拟合,需要将字段类型进行转换,即由字符型转为数值型。结合特征Education(学历程度)属于有序分类变量,可以通过标签编码方式来实现类型转换,具体代码如图4所示。 下面我们通过isnull()函数来了解下特征的缺失情况,打印日志结果如图5所示,可知变量Income_Level、Credit_Index、Consum_Index、Shopping_Index都存在缺失值,可以采用常见统计值指标来进行填充。根据各特征的分布类型,我们对连续型变量的缺失值采用平均值填充,离散型变量的缺失值采用众数填充,具体实现代码如图6所示。 ? 为了避免特征量纲不统一对模型训练效果的影响,我们对样本数据进行标准化处理,现采用z-score标准化方法来实现,具体代码如图7所示。 经过以上特征编码、缺失值填充、特征标准化的数据预处理步骤,我们得到了一份可以作为模型训练输入的数据集,图1样例对应的处理结果如图8所示。 当然,可以进一步根据特征相关性(pearson)、特征共线性(VIF)等特征工程分析来对变量池进行筛选,以提高模型训练拟合的效果。当完成特征变量的相关分析后,就是回归模型算法的选择。对于机器学习回归算法,除了我们最常见的最小二乘法线性回归,其实回归算法包括很多种,而且其中一部分回归算法也经常被采用,同时在具体场景实践中也有比较好的性能表现。本文接下来便为大家介绍下比较常用的几种回归算法,并且围绕以上样本数据案例,通过多种回归模型算法来实现客户价值度预测的业务场景需求。 2、常见回归算法 3、回归模型实现 ? 根据图10模型训练与模型评估的代码结构,更换不同回归算法,可得到各模型的评价指标如图11所示。 由上图的模型结果分析可知,针对本文的样本数据情况,决策树回归算法模型的评价指标R_Square(决定系数)最高(0.9719),说明模型拟合的效果很好。为了提高模型的解释度,我们根据决策树回归模型输出各特征变量的重要性系数,具体实现代码如图12所示,结果如图13所示。 ? 从各特征变量的重要性系数结果可知,在本文案例场景下的客户价值度预测模型中,特征Shopping_Index(网购指数)的最为重要(0.287568),而特征Income_Level(收入等级)的重要度最低(0.0163186)。 更多内容,有兴趣的童鞋可关注: … ~原创文章 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 3:29:42- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |