| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 数据结构与算法 -> 线性模型——最小二乘法,梯度下降,线性回归,logistic回归 -> 正文阅读 |
|
[数据结构与算法]线性模型——最小二乘法,梯度下降,线性回归,logistic回归 |
线性模型——最小二乘法,梯度下,线性回归,logistic回归(逻辑回归)(一)基本形式
f ( X ) = w 1 x 1 + w 2 x 2 + … + w d x d + b f(X) = w_1x_1 + w_2x_2+…+w_dx_d+b f(X)=w1?x1?+w2?x2?+…+wd?xd?+b 向量形式:
(二)线性回归(linear regression)
1.最小二乘法(least square method)
( w ? , b ? ) = a r g m i n ∑ i = 1 m ( f ( x i ) ? y i ) 2 = a r g m i n ∑ i = 1 m ( y i ? w x i ? b ) 2 ( w ? , b ? 表 示 w , b 的 解 ) (w^*,b^*) = arg min\sum_{i=1}^{m}{(f(x_i) - y_i)^2} = argmin\sum_{i=1}^{m}{(y_i-wx_i-b)^2}(w^*,b^*表示w,b的解) (w?,b?)=argmini=1∑m?(f(xi?)?yi?)2=argmini=1∑m?(yi??wxi??b)2(w?,b?表示w,b的解) E ( w , b ) = ∑ i = 1 m ( y i ? w x i ? b ) 2 E(w,b) = \sum_{i=1}^{m}{(y_i - wx_i - b)^2} E(w,b)=i=1∑m?(yi??wxi??b)2
以上是针对一个属性的样本求解,对于一般情形,样本由d个属性描述,此时我们试图学得 使用正则方程组必须满足XTX可逆,即为满秩矩阵。但是在实际问题中,数据集的特征数n可能大于数据集规模m,这导致矩阵不可逆。因此,通常在计算(xTx)^-1之前在xTx加上一个较小的可逆矩阵,如0.001E(E为单位矩阵)。
注:上述的最小二乘估计解释和下面的梯度下降算法都来自于《机器学习入门基于数学原理的Python实战》戴璞微,潘斌。 2.梯度下降算法虽然迭代更新的算法有很多种,但是梯度下降算法是最好理解的一种。当前梯度下降算法主要分为三种:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QGDu2hsk-1628868467972)(D:\Program Files\Typora\picture\BGD.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-szcoUYSc-1628868467975)(D:\Program Files\Typora\picture\SGD.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8uFpqHZ2-1628868467977)(D:\Program Files\Typora\picture\MBGD.png)]
综合上述的三种算法,当损失函数为均方误差(MSE)时,可以得到一个统一的更新公式:
(三)广义线性模型(generalized linear model)
y = g ? 1 ( w t x + b ) y = g^{-1}(w^{t}x + b) y=g?1(wtx+b) 这样得到的模型称为"广义线性模型",其中g(·)称为“联系函数”。 (四)对数几率回归(logistic regression/logit regression)虽然名称为对数几率回归,但是是用来解决分类问题的。
y = 1 1 + e ? z y = \frac{1}{1 + e^{-z}} y=1+e?z1? y = 1 1 + e ? z = > z = l n y 1 ? y z = w T x + b = > y = 1 1 + e ? ( w T x + b ) l n y 1 ? y = w T x + b y = \frac{1}{1 + e^{-z}} \quad = >\quad z = ln\frac{y}{1-y}\\ z = w^Tx +b\quad=>\quad y=\frac{1}{1+e^{-(w^{T}x+b)}}\\ ln\frac{y}{1-y}=w^{T}x+b y=1+e?z1?=>z=ln1?yy?z=wTx+b=>y=1+e?(wTx+b)1?ln1?yy?=wTx+b
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/11 14:44:01- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |