| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> PyTorch 入坑十一: 损失函数、正则化----深刻剖析softmax+CrossEntropyLoss -> 正文阅读 |
|
[人工智能]PyTorch 入坑十一: 损失函数、正则化----深刻剖析softmax+CrossEntropyLoss |
这里写目录标题概念Loss Function计算一个样本的损失: Cost Function整个训练集(或者batch)的损失平均值 Objective Function目标函数是一个更广泛的概念,在机器学习中,目标函数包含Cost和Regularization(正则项):
正则化方差的概念参考:方差 正则化策略的目的就是降低方差,减小过拟合的发生。 常用的手段有:L1正则化、L2正则化、Dropout、提前终止(早停)、数据扩增。 损失函数交叉熵损失函数nn.CrossEntropyLoss()
自信息自信息用于衡量单个事件的不确定性,其公式为: 熵(信息熵)熵指的是信息熵,是自信息的期望。用来描述一个事件的不确定性,一个事件越不确定熵越大。熵是整个概率分布的不确定性,用来描述整个概率分布 相对熵(KL散度)相对熵也称为KL散度,相对熵用于衡量两个分布之间的差异,也就是两个分布之间的距离,虽然相对熵可以计算两个分布之间的距离,但是相对熵不是一个距离函数,因为距离函数具有对称性,对称性指的是P到Q的距离等于Q到P的距离,但是相对熵不具备距离函数的对称性。 交叉熵交叉熵、KL散度、信息熵的关系: 二分类多分类学习过程交叉熵损失函数经常用于分类问题中,特别是在神经网络做分类问题时,也经常使用交叉熵作为损失函数。此外,由于交叉熵计算中需要输入属于某一类的概率,所以交叉熵几乎每次都和sigmoid(或softmax)函数一起出现。
同MSE(Mean Squared Error)相比的优势首先来看sigmoid+MSE的缺点:
sigmoid+ CELoss的优点 工程实现中的问题与措施
softmax的缺点前面说到,softmax一般配合CEloss一起使用。但是softmax这个操作具体什么含义呢。
在CNN的分类问题中,我们的ground truth是one-hot形式,下面以四分类为例,理想输出应该是(1,0,0,0),或者说(100%,0%,0%,0%),这就是我们想让CNN学到的终极目标。 相同输出特征情况,soft max比hard max更容易达到终极目标one-hot形式,或者说,softmax降低了训练难度,使得多分类问题更容易收敛。同时Softmax鼓励真实目标类别输出比其他类别要大,但并不要求大很多。对于人脸识别的特征映射(feature embedding)来说,Softmax鼓励不同类别的特征分开,但并不鼓励特征分离很多,如上表(5,1,1,1)时loss就已经很小了,此时CNN接近收敛梯度不再下降。
PyTorch中 CEloss应用PyTorch中 CrossEntropyLoss 等价于 LogSoftmax + NLLLoss CrossEntropyLoss 等价于 LogSoftmax + NLLLoss PyTorch中的其他损失函数nn.BCELoss功能:二分类交叉熵; nn.BCEWithLogitsLossBCEWithLogitsLoss就是把Sigmoid-BCELoss合成一步 更多loss参考PyTorch中更多loss说明 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/11 16:50:07- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |