IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 分类蒸馏综述(一) -> 正文阅读

[人工智能]分类蒸馏综述(一)

本文介绍了分类蒸馏的八篇论文

自蒸馏

Be Your Own Teacher: Improve the Performance of Convolutional Neural Networks via Self Distillation

Self Distillation文中提出的自蒸馏方法,相比于传统蒸馏方法来说,无需提前训练教师网络,而是在学生网络训练的过程中进行自蒸馏,不仅可以训练出更高精度的小网络,而且花费的时间更少。

在这里插入图片描述
文中使用的自蒸馏方法如下:

在这里插入图片描述
如图所示,一个ResNet根据其深度分为四个部分,在每一部分之后设置额外的bottleneck和全连接层,构成多个分类器。每一个分类器在途中描述的三种监督下训练。

MSD: MULTI-SELF-DISTILLATION LEARNING VIA MULTI-CLASSIFIERS WITHIN DEEP NEURAL NET- WORKS

MSD与Self Distillation思路类似,损失函数也包含三个相同的部分。区别主要在于使用了多分类器。

在这里插入图片描述

多教师蒸馏

FEED: Feature-level Ensemble for Knowledge Distillation

FEED提出了两种蒸馏多教师蒸馏方法,并行蒸馏和顺序蒸馏。

并行蒸馏的流程图如下图所示。其中,NTL是非线性转换层的简称,每个教师网络分配一个NTL,蒸馏过程中,学生网络和NTL网络同时进行培训。
在这里插入图片描述
顺序蒸馏的流程图如下图所示。经过训练的学生网络被用作下一阶段的教师网络,并重复这个过程。

在这里插入图片描述

Adaptive Multi-Teacher Multi-level Knowledge Distillation

AMTML-KD是一种融合多教师蒸馏的方法,使用到的损失函数包含

  1. FitNet的损失函数
  2. Similarity中的损失函数
  3. KL损失函数
    在这里插入图片描述

相互蒸馏

Deep Mutual Learning

如图所示,每个网络都用一个监督学习损失和KL损失进行训练,以匹配其他网络的概率估计。
在这里插入图片描述

剪枝蒸馏

Training convolutional neural networks with cheap convolutions and online distillation

文中提出利用cheap conv的压缩网络进行在线蒸馏,进一步提高其性能:

  1. 用cheap conv代替标准卷积,形成一个学生网络。
  2. 通过将多个学生网络的输出特征连接起来并添加新的分类器,在线构建一个强教师网络。
  3. 在培训过程中进行相互学习,提高师生之间的表现。

在这里插入图片描述
文中对使用的几种空间卷积进行了说明:(a)标准卷积,(b)组卷积,( c)深度卷积

在这里插入图片描述

Cascaded channel pruning using hierarchical self-distillation

文中提出了一种通道修剪的分层自蒸馏策略。每个模型都用共享的卷积权值联合训练,但有独立的二进制掩码、批处理标准化层和分类层。约束较小的模型提供知识蒸馏和重要性评分梯度。
在这里插入图片描述

Cascaded channel pruning using hierarchical self-distillation

该方法使用到了知识蒸馏、网络集成和网络剪枝:

  1. 根据一些标准(1范数、泰勒近似等)对滤波器/权重进行修剪。
  2. 对具有较大学习速率的剪枝网络进行再训练,使传统的监督损失函数最小化。
  3. 达到期望的剪枝率后,使用知识蒸馏将知识从迭代剪枝集合转移到最终模型。

在这里插入图片描述

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-09-03 11:53:35  更:2021-09-03 11:55:00 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 16:51:41-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码