IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 数据结构与算法 -> 大厂面试机器学习算法(2)回归算法常考问题 -> 正文阅读

[数据结构与算法]大厂面试机器学习算法(2)回归算法常考问题

线性回归、Lasso回归、岭回归、逻辑回归的损失函数

线性回归:
J ( θ ) = 1 2 m ∑ i = 1 m ( h ( x ( i ) ) ? y ( i ) ) 2 J(\theta)=\frac{1}{2m}\sum_{i=1}^m(h(x^{(i)})-y^{(i)})^2 J(θ)=2m1?i=1m?(h(x(i))?y(i))2
Lasso回归:
J ( θ ) = 1 2 m ∑ i = 1 m ( h ( x ( i ) ) ? y ( i ) ) 2 + λ ∑ j = 1 n ∣ θ ∣ J(\theta)=\frac{1}{2m}\sum_{i=1}^m(h(x^{(i)})-y^{(i)})^2+\lambda\sum_{j=1}^{n}|\theta| J(θ)=2m1?i=1m?(h(x(i))?y(i))2+λj=1n?θ
岭回归:
J ( θ ) = 1 2 m ∑ i = 1 m ( h ( x ( i ) ) ? y ( i ) ) 2 + λ ∑ j = 1 n θ 2 J(\theta)=\frac{1}{2m}\sum_{i=1}^m(h(x^{(i)})-y^{(i)})^2+\lambda\sum_{j=1}^{n}\theta^2 J(θ)=2m1?i=1m?(h(x(i))?y(i))2+λj=1n?θ2
LR:
J ( θ ) = ? 1 m ∑ i = 1 m [ ( 1 ? y ( i ) ) l o g ( 1 ? h ( x ( i ) ) ) + y ( i ) l o g ( h ( x ( i ) ) ) ] J(\theta)=-\frac{1}{m}\sum_{i=1}^m[(1-y^{(i)})log(1-h(x^{(i)}))+y^{(i)}log(h(x^{(i)}))] J(θ)=?m1?i=1m?[(1?y(i))log(1?h(x(i)))+y(i)log(h(x(i)))]

推导LR

LR的损失函数推导

根据sigmoid函数的定义, P ( y = 1 ∣ x , θ ) = h ( x ) P(y=1|x,\theta)=h(x) P(y=1x,θ)=h(x) P ( y = 0 ∣ x , θ ) = 1 ? h ( x ) P(y=0|x,\theta)=1-h(x) P(y=0x,θ)=1?h(x)
因此, P ( y ∣ x , θ ) = h ( x ) y [ 1 ? h ( x ) ] 1 ? y P(y|x,\theta)=h(x)^y[1-h(x)]^{1-y} P(yx,θ)=h(x)y[1?h(x)]1?y
目标是最大化 P ( y ∣ x ) P(y|x) P(yx),即最大化其对数。
令似然函数L= P ( y ∣ x ) P(y|x) P(yx) l n L = y l o g ( h ( x ) + ( 1 ? y ) l o g ( 1 ? h ( x ) ) lnL=ylog(h(x)+(1-y)log(1-h(x)) lnL=ylog(h(x)+(1?y)log(1?h(x))
损失函数求最小化,注意加负号: J ( θ ) = ? 1 m ∑ i = 1 m [ y ( i ) l o g ( h ( x ( i ) ) ) + ( 1 ? y ( i ) ) l o g ( 1 ? h ( x ( i ) ) ) ] J(\theta)=-\frac{1}{m}\sum_{i=1}^m[y^{(i)}log(h(x^{(i)}))+(1-y^{(i)})log(1-h(x^{(i)}))] J(θ)=?m1?i=1m?[y(i)log(h(x(i)))+(1?y(i))log(1?h(x(i)))]

LR的导数推导

对损失函数 J ( θ ) = ? 1 m ∑ i = 1 m [ y ( i ) l o g ( h ( x ( i ) ) ) + ( 1 ? y ( i ) ) l o g ( 1 ? h ( x ( i ) ) ) ] J(\theta)=-\frac{1}{m}\sum_{i=1}^m[y^{(i)}log(h(x^{(i)}))+(1-y^{(i)})log(1-h(x^{(i)}))] J(θ)=?m1?i=1m?[y(i)log(h(x(i)))+(1?y(i))log(1?h(x(i)))]求导:
J ′ ( θ j ) = ? 1 m ∑ i = 1 m [ y ( i ) h θ ′ ( x ( i ) ) h ( x ( i ) ) + ( 1 ? y ( i ) ) h θ ′ ( x ( i ) ) 1 ? h ( x ( i ) ) ] = ? 1 m ∑ i = 1 m [ y ( i ) h ( x ( i ) ) [ 1 ? h ( x ( i ) ) ] ( x j ( i ) ) h ( x ( i ) ) + ( 1 ? y ( i ) ) h ( x ( i ) ) [ 1 ? h ( x ( i ) ) ] ( x j ( i ) ) 1 ? h ( x ( i ) ) ] = ? 1 m ∑ i = 1 m [ ( y ( i ) ? h ( x ( i ) ) ) x j ( i ) ] \begin{aligned} J'(\theta_j)&=-\frac{1}{m}\sum_{i=1}^m[y^{(i)}\frac{h'_{\theta}(x^{(i)})}{h(x^{(i)})}+(1-y^{(i)})\frac{h'_{\theta}(x^{(i)})}{1-h(x^{(i)})}]\\[2ex] &=-\frac{1}{m}\sum_{i=1}^m[y^{(i)}\frac{h(x^{(i)})[1-h(x^{(i)})](x_j^{(i)})}{h(x^{(i)})}+(1-y^{(i)})\frac{h(x^{(i)})[1-h(x^{(i)})](x_j^{(i)})}{1-h(x^{(i)})}]\\[2ex] &=-\frac{1}{m}\sum_{i=1}^m[(y^{(i)}-h(x^{(i)}))x_j^{(i)}] \end{aligned} J(θj?)?=?m1?i=1m?[y(i)h(x(i))hθ?(x(i))?+(1?y(i))1?h(x(i))hθ?(x(i))?]=?m1?i=1m?[y(i)h(x(i))h(x(i))[1?h(x(i))](xj(i)?)?+(1?y(i))1?h(x(i))h(x(i))[1?h(x(i))](xj(i)?)?]=?m1?i=1m?[(y(i)?h(x(i)))xj(i)?]?
θ j = θ j + α 1 m ∑ i = 1 m [ ( y ( i ) ? h ( x ( i ) ) ) x j ( i ) ] \theta_j=\theta_j+\alpha\frac{1}{m}\sum_{i=1}^m[(y^{(i)}-h(x^{(i)}))x_j^{(i)}] θj?=θj?+αm1?i=1m?[(y(i)?h(x(i)))xj(i)?]
对比线性回归对参数的导数: J ′ ( θ j ) = 1 m ∑ i = 1 m ( h ( x ( i ) ) ? y ( i ) ) x j ( i ) J'(\theta_j)=\frac{1}{m}\sum_{i=1}^m(h(x^{(i)})-y^{(i)})x_j^{(i)} J(θj?)=m1?i=1m?(h(x(i))?y(i))xj(i)?
θ j = θ j + α 1 m ∑ i = 1 m [ ( y ( i ) ? h ( x ( i ) ) ) x j ( i ) ] \theta_j=\theta_j+\alpha\frac{1}{m}\sum_{i=1}^m[(y^{(i)}-h(x^{(i)}))x_j^{(i)}] θj?=θj?+αm1?i=1m?[(y(i)?h(x(i)))xj(i)?]
可以发现二者虽然损失函数不同,但导数和梯度下降的公式却是相同的(神奇)

  数据结构与算法 最新文章
【力扣106】 从中序与后续遍历序列构造二叉
leetcode 322 零钱兑换
哈希的应用:海量数据处理
动态规划|最短Hamilton路径
华为机试_HJ41 称砝码【中等】【menset】【
【C与数据结构】——寒假提高每日练习Day1
基础算法——堆排序
2023王道数据结构线性表--单链表课后习题部
LeetCode 之 反转链表的一部分
【题解】lintcode必刷50题<有效的括号序列
上一篇文章      下一篇文章      查看所有文章
加:2021-07-14 23:11:55  更:2021-07-14 23:14:31 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/27 10:04:03-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码
数据统计