| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 机器学习作业二-线性回归预测销售额 -> 正文阅读 |
|
[人工智能]机器学习作业二-线性回归预测销售额 |
题目如下:? advertising.csv文件是某商品的广告推广费用(单位为元)和销售额数据(单位为千元),其中每行代表每一周的广告推广费用(包含微信、微博和其他类型三种广告费用)和销售额。若在未来的某两周,将各种广告投放金额按如下分配,请预测对应的商品销售额: (1)微信:100,微博:100,其他类型:100 (2)微信:200,微博:100,其他类型:50 一、线性回归概念 对于因变量y: 如果它和自变量x呈现y=ax+b关系 称为一元线性。 如果y与多个因素有关。即 y=a1*x1+a2*x2+...? 称为多元线性。 回归要做的就是根据已有x和y 找到a和b,拟合出这一条直线,预测新x所对应的y。 二、题目分析? 首先得到数据(使用pandas),然后画散点图(使用plt)观察三个因素对销量的影响。
? 画出三个要素对应的散点图。发现只有微信部分和销售额有明显线性关系。 ?? ?参考文章机器学习基础线性回归——预测网店的销售额_sjjsaaaa的博客-CSDN博客_线性回归法预测销售额 (上文使用了seaborn库,可以一下子呈现三个坐标轴) 所以本题采用一元线性回归处理(简化了处理) 三、最简单代码 ?对于预测问题,我们可以直接调用sklearn.linear库,直接使用fit和predict函数。 具体学习如下(其中重点注意fit函数的参数):【机器学习】(一) 线性模型之Linear Regression_walk_power的博客-CSDN博客_linearregression函数 所以写出了非常简答的代码:
运行结果如下: ? 四、线性回归建模 只是调用库来建模的话意义不大,下面我们自己来创建这个模型,即自己找到适合的a和b。 在机器学习中,y=ax+b可以专业的写成y=w*x+b。体现权重weight和bias偏置这两个概念。 首先了解一些基本知识: 1.误差函数: 在最小二乘法中,均方误差函数的数学表达式,刻画的是每个点的y和拟合出来的直线y撇的差距: ? 均方误差函数(MSE)代码如下
2.梯度下降 对于上面这个loss_function函数,它可以表现成与w,b有关的一个三维图像,如下图: ? 我们的目的是找到图像的最低点,在该情况下的w和b拟合出的直线最为贴近。 一个朴素的处理思想是:先任意确定w和b得到loss,然后不断移动w,b,根据loss的高低来决定移动方向。 这个思想的具体计算方式是依靠导数。 理解梯度:在单变量的函数中,梯度其实就是函数的微分,代表着函数在某个给定点的切线的斜率。梯度下降算法原理讲解——机器学习_Arrow and Bullet-CSDN博客_梯度下降法 对目前的X求导:
具体的求导方式:
知道了w该向哪个方向移动,下面就是怎么移动到最低点的问题。引入概念learnrate 学习率。 以w为例分析。已知当前的x导数为正,在w,y面 则应当向右移动,每次移动lr的长度, 如果lr较小,则得到x1对应y1为肯定比x对应的y更接近最低点。 如果lr较大,有可能越过了最低点,越过情况下y1有可能大于y,此时lr就太大了。 确定lr是这个程序模型拟合的重要一步。 在迭代多次(移动多次lr)以后,我们得到了最接近的w和b
整个程序的运行思路:先任意规定w,b,确定好iter,lr(这个可能有问题) 然后调用梯度下降函数。全部代码如下
如果发现在迭代过程中有Loss越来愈大的情况,说明选择的lr有问题,尝试调小步长。 选择的iter和lr不同,则最终的w和b有误差。 可以将迭代过程中的loss_history, weight_history, bias_history记录下来,最后查看一下。 运行结果: ?
将迭代中的损失记录下来,以图标形式呈现,体现下降趋势。 ? 3.梯度下降的另一种处理 西瓜书上 对于线性回归有向量的表示方法,其中涉及X矩阵和w,b的运算,我们可以将wb看成一个新的变量theta,在拟合的时候变成对theta的处理。 ? ?横坐标theta,纵坐标L。更加直观。具体参照上面的提到的博客。 五、其他完善 1.运用多元回归 基本思路是 将一元中的乘法变成点 乘W的T,修改部分如下 问题1.不知道三元的X怎么样和四元的W[w1,w2,w3,w4]点乘,所以舍去了b ? ? ? ?2.由于本例中第三个元素干扰实在太大,导致多元回归无法得到一个恰当的数值。
2.数据的归一化。用来突出数据的特征,本次没有使用,这部分将在以后学习。 六、总结和反思 1.上面的三种处理方式,最后得到的预测值还是有较大差异,需要研究学习率和循环次数的一个更适合的数值。可以考虑用while循环将误差值控制到一个范围。 2.思考更简便的建立回归模型,思考后面两个元素是否真的没办法用到。 3.再深入了解一下梯度下降的相关内容。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/10 21:01:07- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |