IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 【动手学深度学习】02-softmax回归 -> 正文阅读

[人工智能]【动手学深度学习】02-softmax回归

1、softmax回归

1.1 从回归到分类

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yYcFQoNQ-1646920856537)(02-softmax-regression.assets/image-20220310211751726.png)]

输出i是预测为第i类的置信度。输出的个数等于类别的个数

1

均方损失

n个类别,假设先用1,0表示是否类别正确。使用均方损失训练,最大值作为预测。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-qxVBBon0-1646920856539)(02-softmax-regression.assets/image-20220310213648686.png)]

校验比例

其实我们关心的不是他具体分类的置信度的值是多少。

关心的是是否可以把正确类别的置信度是否特别大,模型能够把真正的类别和其他的类别拉开一个距离,数学表达式为 O y ? O i > = Δ ( y , i ) O_y - O_i >= \Delta(y,i) Oy??Oi?>=Δ(y,i)

引入一个操作子softmax,输出匹配的概率,计算方式使用指数(可以得到非负数,然后和为1)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-cY3PEBb8-1646920856539)(02-softmax-regression.assets/image-20220310214458457.png)]

1.2 softmax和交叉熵损失

其中,求和时, y i y_i yi?中只有真实的类的值才为1,其他的为0,所以损失函数写成 ? l o g y ^ y -log\hat{y}_y ?logy^?y?

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VJg0zRBr-1646920856540)(02-softmax-regression.assets/image-20220310214807037.png)]

我们不关心对于非正确类的预测值,我们只关心对于正确类的预测值

损失函数的梯度就是真实概率和预测概率的区别

1.3总结

  • softmax回归是一个多类分类模型
  • 使用softmax操作子得到每一个类的预测置信度
  • 使用交叉熵来衡量预测和标号的区别

2、损失函数

L2 LOSS :

l ( y , y ‘ ) = 1 2 ( y ? y ‘ ) 2 l(y,y^`)=\frac{1}{2}(y-y^`)^2 l(y,y)=21?(y?y)2??

蓝色为原函数(y取零),橙色为其导数,绿色为其对应的似然函数(统计学里面的)。可以看到里预测值和真实值差距越大,其梯度比较大,对参数的更新也就比较多。随着预测值慢慢靠近真实值,梯度慢慢变小。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-env5l9vq-1646920856540)(02-softmax-regression.assets/image-20220128210250970.png)]

L1 LOSS :

l ( y , y ‘ ) = ∣ y ? y ‘ ∣ l(y,y^`)=|y-y^`| l(y,y)=y?y?

该函数的导数在不等于0的情况下都是常数,所以好处就是梯度不会随着预测值的变化而变化(同一个大区间内)。其坏处就是在0点处导数不可导,还有当跨区间时,导数会在-1和1二者之间变化

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZZ9Mvnl4-1646920856541)(02-softmax-regression.assets/image-20220128210917127.png)]

HUber’ s Robust Loss

可以看做以上两种函数的结合 ,好处就是,当预测值和真实值相差较大时,梯度会以均匀的力度往回推,当相差比较小的时候,梯度会随着差距减小而慢慢变小,这就就能保障在优化末期的时候优化是比较平滑的,不会出现太多的数值问题。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-D4GGCGvt-1646920856542)(02-softmax-regression.assets/image-20220128211452297.png)]

(img-guWAujWx-1646920856543)(02-softmax-regression.assets/image-20220128211707812.png)]

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-03-12 17:30:27  更:2022-03-12 17:34:40 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 16:50:38-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码