IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 多分类模型如何将LabelSmoothing与MixUp联合使用? -> 正文阅读

[人工智能]多分类模型如何将LabelSmoothing与MixUp联合使用?

LabelSmoothing

????????以图像分类为例,网络模型的最后一层的输出维度等于总的类别数,然后使用softmax将网络预测输出转换为对应类别的概率分布,表示如下:

????????然后使用交叉熵损失函数来衡量网络预测输出的概率分布和真实的样本标签(one-hot编码)之间的分布差异,计算损失,训练模型。

????????由于样本的真是标签通常采用one-hot编码,导致在模型训练时,强行将正类的预测结果zi 推向无穷大,这样导致模型的学习结果过于极端(过于自信),导致模型的泛化性能下降。

????????为了缓解模型这种过于自信的表现,Label Smoothing对one-hot编码过程进行改进,Label Smoothing表示如下:

????????ε 通常取值为0.1,这样在模型训练时,正样本的概率就不再是1.0了,而是0.9,负样本的概率也不再是0.0了,而是一个很小的但是不为0的值,以此来缓解模型训练过程中出现的过度自信问题。

MixUp

参考:数据增强之MixUp_胖胖大海的博客-CSDN博客_数据增强mixup代码

????????MixUp用在输入端进行数据增强,Mixup的本意是将任意两个有标签的训练数据进行融合,得到一个新的数据,新数据对应的标签就是两个数据标签的融合,表示如下:

????????这样,在模型训练阶段,因为融合是随机的,所以起到了数据增强的作用,同时由于融合将两个one-hot的标签融合之后得到的新标签不再是one-hot的形式,也起到了一定的LabelSmoothing的作用。

LabelSmoothingMixUp共用

????????通过上面的介绍,我们知道了LabelSmoothing和MixUp的作用,以及实现原理,那如何将LabelSmoothing和MixUp联合使用呢?以下是个人理解:

????????MixUp之后输出的结果不再是one-hot的形式,而LabelSmoothing的输入要求是one-hot形式,所以我们要保持MixUp之后的结果依然是one-hot的形式,在MixUp的pytorch官方实现版本中,同时返回了两个标签融合之前的one-hot编码,然后再损失函数阶段再进行融合,如下:

????????这样,经过MixUp之后得到的还是one-hot编码的label,然后再这个label之上就可以使用LabelSmoothing了。

代码地址:mixup-cifar10/train.py at main · facebookresearch/mixup-cifar10 · GitHub

Cifar100训练对比

训练方式验证集准确率
CrossEntropy + StepLR0.8055
CrossEntropy + CosineLR0.8096
CrossEntropy + CosineLR + MixUp
CrossEntropy + CosineLR + LabelSmoothing
CrossEntropy + CosineLR + LabelSmoothing + MixUp0.8393

代码地址:?https://github.com/xxcheng0708/Pytorch_Image_Classifier_Template/blob/master/train_cifar100_model.py

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-06-20 23:00:25  更:2022-06-20 23:02:46 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 3:39:19-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码