IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 数据结构与算法 -> 逻辑回归损失函数公式推导 -> 正文阅读

[数据结构与算法]逻辑回归损失函数公式推导

P ( y ∣ x ; θ ) = { h θ ( x ) , y = 1 1 ? h θ ( x ) , y = 0 P(y|x;\theta) = \begin{cases}h_{\theta}(x), &y = 1\\1-h_{\theta}(x),& y = 0\end{cases} P(yx;θ)={hθ?(x),1?hθ?(x),?y=1y=0?

P ( y ∣ x ; θ ) = ( h θ ( x ) ) y ( 1 ? h θ ( x ) ) 1 ? y P(y|x;\theta) = (h_{\theta}(x))^{y}(1 - h_{\theta}(x))^{1-y} P(yx;θ)=(hθ?(x))y(1?hθ?(x))1?y

L ( θ ) = ∏ i = 1 n P ( y ( i ) ∣ x ( i ) ; θ ) L(\theta) = \prod\limits_{i = 1}^nP(y^{(i)}|x^{(i)};\theta) L(θ)=i=1n?P(y(i)x(i);θ)

L ( θ ) = ∏ i = 1 n ( h θ ( x ( i ) ) ) y ( i ) ( 1 ? h θ ( x ( i ) ) ) 1 ? y ( i ) L(\theta) = \prod\limits_{i=1}^n(h_{\theta}(x^{(i)}))^{y^{(i)}}(1 - h_{\theta}(x^{(i)}))^{1-y^{(i)}} L(θ)=i=1n?(hθ?(x(i)))y(i)(1?hθ?(x(i)))1?y(i)

l ( θ ) = ln ? L ( θ ) = ln ? ( ∏ i = 1 n ( h θ ( x ( i ) ) ) y ( i ) ( 1 ? h θ ( x ( i ) ) ) 1 ? y ( i ) ) l(\theta) = \ln{L(\theta)} =\ln( \prod\limits_{i=1}^n(h_{\theta}(x^{(i)}))^{y^{(i)}}(1 - h_{\theta}(x^{(i)}))^{1-y^{(i)}}) l(θ)=lnL(θ)=ln(i=1n?(hθ?(x(i)))y(i)(1?hθ?(x(i)))1?y(i))

l ( θ ) = ln ? L ( θ ) = ∑ i = 1 n ( y ( i ) ln ? ( h θ ( x ( i ) ) ) + ( 1 ? y ( i ) ) ln ? ( 1 ? h θ ( x ( i ) ) ) ) l(\theta) = \ln{L(\theta)} = \sum\limits_{i = 1}^n(y^{(i)}\ln(h_{\theta}(x^{(i)})) + (1-y^{(i)})\ln(1-h_{\theta}(x^{(i)}))) l(θ)=lnL(θ)=i=1n?(y(i)ln(hθ?(x(i)))+(1?y(i))ln(1?hθ?(x(i))))

损失函数

J ( θ ) = ? l ( θ ) = ? ∑ i = 1 n [ y ( i ) ln ? ( h θ ( x ( i ) ) ) + ( 1 ? y ( i ) ) ln ? ( 1 ? h θ ( x ( i ) ) ) ] J(\theta) = -l(\theta) = -\sum\limits_{i = 1}^n[y^{(i)}\ln(h_{\theta}(x^{(i)})) + (1-y^{(i)})\ln(1-h_{\theta}(x^{(i)}))] J(θ)=?l(θ)=?i=1n?[y(i)ln(hθ?(x(i)))+(1?y(i))ln(1?hθ?(x(i)))]

梯度下降

θ j t + 1 = θ j t ? α ? ? θ j J ( θ ) \theta_j^{t + 1} = \theta_j^t - \alpha\frac{\partial}{\partial_{\theta_j}}J(\theta) θjt+1?=θjt??α?θj????J(θ)

h θ ( x ) = g ( θ T x ) = g ( z ) = 1 1 + e ? z h_{\theta}(x) = g(\theta^Tx) = g(z) = \frac{1}{1 + e^{-z}} hθ?(x)=g(θTx)=g(z)=1+e?z1?

g ′ ( z ) = ? ? z 1 1 + e ? z = e ? z ( 1 + e ? z ) 2 = 1 ( 1 + e ? z ) 2 ? e ? z = 1 1 + e ? z ? ( 1 ? 1 1 + e ? z ) = g ( z ) ? ( 1 ? g ( z ) ) \begin{aligned} g'(z) &= \frac{\partial}{\partial z}\frac{1}{1 + e^{-z}} \\\\&= \frac{e^{-z}}{(1 + e^{-z})^2}\\\\& = \frac{1}{(1 + e^{-z})^2}\cdot e^{-z}\\\\&=\frac{1}{1 + e^{-z}} \cdot (1 - \frac{1}{1 + e^{-z}})\\\\&=g(z)\cdot (1 - g(z))\end{aligned} g(z)?=?z??1+e?z1?=(1+e?z)2e?z?=(1+e?z)21??e?z=1+e?z1??(1?1+e?z1?)=g(z)?(1?g(z))?

J ( θ ) = ? ∑ i = 1 n ( y ( i ) ln ? ( h θ ( x i ) ) + ( 1 ? y ( i ) ) ln ? ( 1 ? h θ ( x ( i ) ) ) ) J(\theta) = -\sum\limits_{i = 1}^n(y^{(i)}\ln(h_{\theta}(x^{i})) + (1-y^{(i)})\ln(1-h_{\theta}(x^{(i)}))) J(θ)=?i=1n?(y(i)ln(hθ?(xi))+(1?y(i))ln(1?hθ?(x(i))))

? ? θ j J ( θ ) = ? ∑ i = 1 n ( y ( i ) 1 h θ ( x ( i ) ) ? ? θ j h θ ( x i ) + ( 1 ? y ( i ) ) 1 1 ? h θ ( x ( i ) ) ? ? θ j ( 1 ? h θ ( x ( i ) ) ) ) = ? ∑ i = 1 n ( y ( i ) 1 h θ ( x ( i ) ) ? ? θ j h θ ( x ( i ) ) ? ( 1 ? y ( i ) ) 1 1 ? h θ ( x ( i ) ) ? ? θ j h θ ( x ( i ) ) ) = ? ∑ i = 1 n ( y ( i ) 1 h θ ( x ( i ) ) ? ( 1 ? y ( i ) ) 1 1 ? h θ ( x ( i ) ) ) ? ? θ j h θ ( x ( i ) ) = ? ∑ i = 1 n ( y ( i ) 1 h θ ( x ( i ) ) ? ( 1 ? y ( i ) ) 1 1 ? h θ ( x ( i ) ) ) h θ ( x ( i ) ) ( 1 ? h θ ( x ( i ) ) ) ? ? θ j θ T x = ? ∑ i = 1 n ( y ( i ) ( 1 ? h θ ( x ( i ) ) ) ? ( 1 ? y ( i ) ) h θ ( x ( i ) ) ) ? ? θ j θ T x = ? ∑ i = 1 n ( y ( i ) ? h θ ( x ( i ) ) ) ? ? θ j θ T x = ∑ i = 1 n ( h θ ( x ( i ) ) ? y ( i ) ) x j ( i ) \begin{aligned} \frac{\partial}{\partial{\theta_j}}J(\theta) &= -\sum\limits_{i = 1}^n(y^{(i)}\frac{1}{h_{\theta}(x^{(i)})}\frac{\partial}{\partial_{\theta_j}}h_{\theta}(x^{i}) + (1-y^{(i)})\frac{1}{1-h_{\theta}(x^{(i)})}\frac{\partial}{\partial_{\theta_j}}(1-h_{\theta}(x^{(i)}))) \\\\&=-\sum\limits_{i = 1}^n(y^{(i)}\frac{1}{h_{\theta}(x^{(i)})}\frac{\partial}{\partial_{\theta_j}}h_{\theta}(x^{(i)}) - (1-y^{(i)})\frac{1}{1-h_{\theta}(x^{(i)})}\frac{\partial}{\partial_{\theta_j}}h_{\theta}(x^{(i)}))\\\\&=-\sum\limits_{i = 1}^n(y^{(i)}\frac{1}{h_{\theta}(x^{(i)})} - (1-y^{(i)})\frac{1}{1-h_{\theta}(x^{(i)})})\frac{\partial}{\partial_{\theta_j}}h_{\theta}(x^{(i)})\\\\&=-\sum\limits_{i = 1}^n(y^{(i)}\frac{1}{h_{\theta}(x^{(i)})} - (1-y^{(i)})\frac{1}{1-h_{\theta}(x^{(i)})})h_{\theta}(x^{(i)})(1-h_{\theta}(x^{(i)}))\frac{\partial}{\partial_{\theta_j}}\theta^Tx\\\\&=-\sum\limits_{i = 1}^n(y^{(i)}(1-h_{\theta}(x^{(i)})) - (1-y^{(i)})h_{\theta}(x^{(i)}))\frac{\partial}{\partial_{\theta_j}}\theta^Tx\\\\&=-\sum\limits_{i = 1}^n(y^{(i)} - h_{\theta}(x^{(i)}))\frac{\partial}{\partial_{\theta_j}}\theta^Tx\\\\&=\sum\limits_{i = 1}^n(h_{\theta}(x^{(i)}) -y^{(i)})x_j^{(i)}\end{aligned} ?θj???J(θ)?=?i=1n?(y(i)hθ?(x(i))1??θj????hθ?(xi)+(1?y(i))1?hθ?(x(i))1??θj????(1?hθ?(x(i))))=?i=1n?(y(i)hθ?(x(i))1??θj????hθ?(x(i))?(1?y(i))1?hθ?(x(i))1??θj????hθ?(x(i)))=?i=1n?(y(i)hθ?(x(i))1??(1?y(i))1?hθ?(x(i))1?)?θj????hθ?(x(i))=?i=1n?(y(i)hθ?(x(i))1??(1?y(i))1?hθ?(x(i))1?)hθ?(x(i))(1?hθ?(x(i)))?θj????θTx=?i=1n?(y(i)(1?hθ?(x(i)))?(1?y(i))hθ?(x(i)))?θj????θTx=?i=1n?(y(i)?hθ?(x(i)))?θj????θTx=i=1n?(hθ?(x(i))?y(i))xj(i)??

? ? θ j J ( θ ) = ∑ i = 1 n ( h θ ( x ( i ) ) ? y ( i ) ) x j ( i ) \frac{\partial}{\partial{\theta_j}}J(\theta) = \sum\limits_{i = 1}^n(h_{\theta}(x^{(i)}) -y^{(i)})x_j^{(i)} ?θj???J(θ)=i=1n?(hθ?(x(i))?y(i))xj(i)?

最终梯度更新表达式:

θ j t + 1 = θ j t ? α ? ∑ i = 1 n ( h θ ( x ( i ) ) ? y ( i ) ) x j ( i ) \theta_j^{t+1} = \theta_j^t - \alpha \cdot \sum\limits_{i=1}^{n}(h_{\theta}(x^{(i)}) -y^{(i)})x_j^{(i)} θjt+1?=θjt??α?i=1n?(hθ?(x(i))?y(i))xj(i)?

  数据结构与算法 最新文章
【力扣106】 从中序与后续遍历序列构造二叉
leetcode 322 零钱兑换
哈希的应用:海量数据处理
动态规划|最短Hamilton路径
华为机试_HJ41 称砝码【中等】【menset】【
【C与数据结构】——寒假提高每日练习Day1
基础算法——堆排序
2023王道数据结构线性表--单链表课后习题部
LeetCode 之 反转链表的一部分
【题解】lintcode必刷50题<有效的括号序列
上一篇文章      下一篇文章      查看所有文章
加:2022-02-22 20:51:10  更:2022-02-22 20:52:41 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 15:42:47-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码