IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> Like What Y ou Like: Knowledge Distill via Neuron Selectivity Transfer(2017)------论文阅读笔记 -> 正文阅读

[人工智能]Like What Y ou Like: Knowledge Distill via Neuron Selectivity Transfer(2017)------论文阅读笔记

写在前面

个人觉得这篇文章参考意义不大,过一遍就OK。

Abstract

在本文中,我们提出了一种新的知识转移方法,将其视为一个分布匹配问题。特别是,我们匹配了教师和学生网络中神经元选择性模式的分布。为了实现这一目标,我们通过最小化这些分布之间的最大平均差异(MMD)度量,设计了一个新的KT损失函数。结合原有的损失函数,我们的方法可以显著提高学生网络的性能。

1. Introduction

具体来说,我们利用神经元的选择性知识。这个模型背后的直觉相当简单:每个神经元基本上从原始输入中提取与手头任务相关的特定模式。因此,如果某个神经元在某些区域或样本中被激活,这意味着这些区域或样本共享一些可能与任务相关的共同属性。这种聚类知识对学生网络很有价值,因为它为教师模型的最终预测提供了解释。因此,我们建议在学生模型和教师模型之间调整神经元选择性模式的分布。

KD 的知识是神经元的选择性知识的分布。

在这里插入图片描述

Figure 1. The architecture for our Neuron Selectivity Transfer: the student network is not only trained from ground-truth labels, but also
mimics the distribution of the activations from intermediate layers in the teacher network. Each dot or triangle in the figure denotes its
corresponding activation map of a filter.
图1. 我们的神经元选择性转移体系结构:学生网络不仅是根据地面真相标签进行训练,而且还模拟教师网络中间层的激活分布。图中的每个点或三角形表示其相应的过滤器激活图。

学生学习的是中间层的激活分布。这边文章的蒸馏也相对比较简单,一个是激活函数输出分布和传统输出蒸馏 ( 经过softmax 软化分布的输出)

2. Related Works

3. Background

3.1. Notations

在这里插入图片描述

假设要压缩的神经网络是卷积神经网络(CNN),教师网络称为T,学生网络称为S。
F : 表示 CNN 中某一层的输出特征映射 F∈ RC×HW ( C通道 和 空间尺寸 H×W )
f: 表示 F 的每一行(即每个通道的特征图)f∈ RHW
f·k: 表示F的每一列(即一个位置的所有激活)f·k∈ RC
让 FT 和 FS 分别作为教师和学生网络特定层的特征图。
不丧失一般性的情况下,我们假设FT和FS具有相同的空间维度。如果尺寸不匹配,则可以对其进行插值

3.2. Maximum Mean Discrepancy (最大平均偏差MMD)

MMD 是用来度量两个数据样本的 概率分布的距离
长见识了,概率分布的距离(差异)

在这里插入图片描述

两组样本 X 和 Y ,分布分别 p 和 q 那么,p 和 q 之间的平方MMD距离可以表示为上方公式。

在这里插入图片描述

φ(·)是一个显式映射函数。

进一步扩展它并应用内核技巧。
在这里插入图片描述
在这里插入图片描述

其中k(·,·)是一个核函数,它将样本向量投影到更高或无限维的特征空间。

在这里插入图片描述

再生核希尔伯特空间(RKHS)

可视化结果

在这里插入图片描述

4. Neuron Selectivity Transfer

4.1. Motivation

图2显示了与VGG16 Conv5 3中一个选定神经元的热图混合的两幅图像。

很容易看出这两个神经元具有很强的选择性:左图中的神经元对猴脸很敏感,而右图中的神经元对角色有强烈的激活作用。这种激活实际上意味着神经元的选择性,即什么样的输入可以激发神经元。换句话说,来自神经元的高激活区域可能具有一些与任务相关的相似性,即使这些相似性对于人类的解释可能不是直观的。为了捕捉这些相似性,在学生网络中也应该有神经元模拟这些激活模式。这些观察结果指导我们在教师网络中定义一种新的知识类型:神经元选择性或称为协同激活,然后将其转移到学生网络中

What is wrong with directly matching the feature maps?

将每个空间位置的激活视为一个特征,将每个滤波器的平坦激活图 作为HW维 神经元选择性空间的样本 。这个样本分布反映了CNN如何解释输入图像:CNN关注的是什么?CNN更强调哪种类型的激活模式?对于分布匹配,直接匹配其中的样本不是一个好的选择,因为它忽略了空间中的样本密度。因此,我们采用了更先进的分布对齐方法,如下所述。

具体什么意思呢?
个人解释来说:1.HW 维度的平坦激活图 对于神经元空间位置选择 具有指导意义。2.未激活之前的特张图并不能清楚了解激活后 CNN 所关注的信息 和 激活方式 。

4.2. Formulation

在这里插入图片描述
f: 表示 F 的每一行(即每个通道的特征图)f∈ RHW ,代表特定神经元的选择性知识
在这里插入图片描述
H 就是传统对于输出的KD
在这里插入图片描述
在这里插入图片描述

其中**k(·,·)**是一个核函数,它将样本向量投影到更高或无限维的特征空间。
MMD 最大平均偏差
k 的括号里是样本个例,只不过单位化了而已。
这里公式是因为二范式展开,没有什么难点。

在这里插入图片描述

这里核函数给了三个方法,线性,多项式,高斯。

4.3. Discussion

注意 : 归于本意 。 k 核函数是为了干嘛? 主要还是表示样本分布而演化而来的。

4.3.1 Linear Kernel

在这里插入图片描述

感觉这里作者故意混淆我们,公式换来换去的。

整理一下:

在这里插入图片描述在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

对于ReLU层之后的激活贴图,其已经是非负的,除归一化形式外,等式5等同于等式8。它们都代表了神经元有高反应的地方,即教师网络的“注意力”。因此,[38]在我们的框架中是一个特例。

归结于一点,Linear Kernel 的 核函数 k 激活函数后的,所想蒸馏的信息依旧还是注意力,因此该篇文章不具参考意义不大。

4.3.2 Polynomial Kernel

在这里插入图片描述
在这里插入图片描述

== 这里则表明多项式核函数 k ,当c = 0 是就转变成FSP 矩阵 ,相当于 FSP_KD 的想法。==

5. Experiments

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

有什么错误欢迎指正!!!

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-09-11 18:48:52  更:2021-09-11 18:51:11 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/22 3:17:13-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码