[数据结构与算法] 简单线性回归解析解最小二乘法

IT数码购物网址头条软件日历阅读图书馆

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

图片批量下载器
↓批量下载图片,美女图库↓

图片自动播放器
↓图片自动播放器↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 数据结构与算法 -> 简单线性回归解析解最小二乘法 -> 正文阅读

[数据结构与算法]简单线性回归解析解最小二乘法

??这里所说的简单线性是指一元线性回归，即特征个数为1，样本个数为n个。符号表示中 $\hat y_i$ 表示的是对第 i 个样本的预测值。所以损失函数为：

???? $\large L(\pmb w, b) = \sum\limits_{i=1}^n \frac 12 (y_i - \hat y_i)^2 = \sum\limits_{i=1}^n \frac 12((\pmb w^T \pmb x_i + b) - y_i)^2 = \frac 12 (\pmb x\pmb w - \pmb y)^T(\pmb x \pmb w - \pmb y)$

??在训练模型时，我们希望寻找一组参数 $(\pmb w^*, b^*)$ ，这组参数能最小化在所有训练样本上的总损失。如下式：

???? $\pmb w^*, b^* = argmin_{\pmb w, b} L(\pmb w, b)$

??由于此函数 $L(\pmb w, b)$ 是凸函数，所以极值点是最小值点。利用上述公式开始推导：

化简

?? $\large L(\pmb w, b) = \large\frac 12 (\pmb x \pmb w - \pmb y)^T(\pmb x \pmb w - \pmb y)$
???? $=\large \frac 12((\pmb x \pmb w)^T - \pmb y^T)(\pmb x \pmb w - \pmb y)$
???? $\large \frac 12 (\pmb w^T \pmb x^T - \pmb y^T)(\pmb x \pmb w - \pmb y)$
???? $=\large \frac 12 (\pmb w^T \pmb x^T \pmb x\pmb w - \pmb w^T \pmb x^T \pmb y -\pmb y^T \pmb x \pmb w + \pmb y^T\pmb y)$
注:

$\large \frac {\partial \pmb w^T\pmb A \pmb w} {\partial\pmb w} = \pmb {2Aw}$

$\large \frac {\partial \pmb{w^TA}} {\partial \pmb w} = \pmb A$

$\large \frac {\partial \pmb {Aw}} {\partial \pmb w} = \pmb A^T$

对 $\pmb w$ 进行求导:

$\large \frac {\partial L} {\partial \pmb w} = [\frac {\large 1} {\large 2} (\pmb w^T \pmb x^T \pmb x\pmb w - \pmb w^T \pmb x^T \pmb y -\pmb y^T \pmb x \pmb w + \pmb y^T\pmb y)]$

$\large = \frac {\large 1} {\large 2}[(\pmb w^T \pmb x^T \pmb x\pmb w)' - (\pmb w^T \pmb x^T \pmb y)' - (\pmb y^T \pmb x \pmb w)' + (\pmb y^T\pmb y)']$

$\large = \frac {\large 1} {\large 2} [2\pmb x^T \pmb x \pmb w - \pmb x^T\pmb y - (\pmb y^T \pmb x)^T]$

$\large = \frac {\large 1} {\large 2} [2\pmb x^T \pmb x \pmb w - 2\pmb x^T \pmb y]$

$\large = \pmb {x^Txw} - \pmb {x^Ty}$

假设我们找到了最优解，即梯度为0。将损失关于 $\pmb w$ 的导数设为0，得到解析解：

$\large \pmb {w^*} = (\pmb x^T \pmb x)^{-1}\pmb x^T\pmb y$

或者当样本 $i$ 的预测值为 $\large \hat y_i$ ，其相应的真实标签为 $\large y_i$ 时，平方误差可以定义为以下公式：

???? $\large l_i(\pmb w, b) = \frac 12 (\hat y_i - y_i)^2$

由于平方误差函数中的二次方项，估计值 $\large \hat y_i$ 和观测值 $\large y_i$ 之间较大的差异将导致更大的损失。为了度量模型在整个数据集上的质量，我们需计算在训练集个样本上的损失均值（也等价于求和）

???? $\large L(\pmb w, b) = \frac 1n \sum\limits_{i=1}^nl_i(\pmb w, b) = \frac 1n \sum\limits_{i=1}^n \frac12(\pmb w^T\pmb x_i + b - y_i)^2$

为了简化问题，可以忽略偏置（我们可以通过向添加所有值为1的一列来做到这一点）。也就是

$\pmb {X \leftarrow [x, 1]}$

$\pmb {w \leftarrow \begin{bmatrix} w \\ b \end{bmatrix}}$

至此我们的预测问题(推导出使用平方误差的线性回归优化问题的解析解)是最小化

???? $\large l(\pmb {X, y, w}) = \frac {\large 1} {\large 2n} || \pmb {y - Xw}||^2$

注：

$\frac {\large \partial ||x^2||} {\large \partial x} = \large {2x^T}$

$\frac {\large \partial Ax} {\large \partial x} = \large A$

计算损失函数对 $\pmb w$ 的梯度

$\frac {\large \partial} {\large \partial \pmb w} \large \pmb {l(X, y, w)} = \frac {\large 1} {\large n}(\pmb {y - Xw})^TX$

由于此函数 $\large l(\pmb {X, y, w})$ 是凸函数，所以极值点是最小值点。也就是在损失平面上只有一个临界点，这个临界点对应于整个区域的损失极小点。

将损失函数关于 $\pmb w$ 的导数设为0，求解矩阵方程来找到解析解

$\frac {\large \partial} {\large \partial \pmb w} \large \pmb {l(X, y, w)} = \frac {\large 1} {\large n}(\pmb {y - Xw})^TX = 0$

得到最优解

$\large \pmb {w^*} = \pmb{(X^TX)^{-1}X^Ty}$

数据结构与算法最新文章

【力扣106】从中序与后续遍历序列构造二叉

leetcode 322 零钱兑换

哈希的应用：海量数据处理

动态规划|最短Hamilton路径

华为机试_HJ41 称砝码【中等】【menset】【

【C与数据结构】——寒假提高每日练习Day1

基础算法——堆排序

2023王道数据结构线性表--单链表课后习题部

LeetCode 之反转链表的一部分

【题解】lintcode必刷50题＜有效的括号序列

上一篇文章下一篇文章查看所有文章

加:2022-09-04 01:36:44 更:2022-09-04 01:38:49

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

360图书馆购物三丰科技阅读网日历万年历 2025年7日历

-2025/7/19 13:10:42-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码