IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> MobileNetV2 -> 正文阅读

[人工智能]MobileNetV2

该论文是《MobileNetV2: Inverted Residuals and Linear Bottlenecks》。

1. 研究问题

研究新的移动架构。

2. 研究方法

MobileNetV2提出了两个创新点:倒置的残差结构和线性瓶颈。其中倒置的残差结构相比于MobileNetV1的残差结构可以提取更多特征,线性瓶颈替代非线性ReLU可以减小特征损失。

2.1 线性瓶颈

这部分有一个很难懂的概念——感兴趣的流形(manifold of interest)。意思就是说网络的每一层都是对感兴趣的流形的学习,这些流形可以通过降维(比如1*1卷积)嵌入到低维空间中。

文章举了个例子,MobileNetV1中的宽度乘数可以减小激活空间的维度,这个就是将感兴趣流形嵌入到低维空间中。通过低维嵌入,直到感兴趣流形跨越整个空间,此时网络能达到准确度和计算代价的最佳平衡。

但由于ReLU非线性激活层的非线性化,会打破以上的一个假想。因为加上ReLU后,深度网络仅在非零部分具有线性分类器的能力。这里的意思是ReLU使得原有的特征丢失了一部分。

紧接着,文章做了一个实验,证明了将输入流形嵌入到低维空间中,那么 ReLU 变换会保留信息,同时将所需的复杂性引入可表达的函数集。实验结果如下所示:

在这里插入图片描述

上面已经可以得到一个结论:ReLU本身会损坏特征信息,所以,文章的第一个创新点就是线性瓶颈,意思就是将原始残差块中的低维流形后的ReLU去掉,而替换为线性的1*1卷积。

2.2 倒置的残差结构

不多说,直接上图。。。

在这里插入图片描述
在这里插入图片描述
上面两图首先是标准残差和倒置残差的对比,下图是倒置残差的bottlenect结构,t是扩张率,大于1.

标准残差是先“压缩”,后“扩张”。而倒置残差是先“扩张”,后“压缩”,目的是为了提取更多的特征。因为MobileNet是轻量化网络,如果使用标准残差的bottlenect会倒置特征损失过多。

倒置残差沿用了MobileNetV1中的深度可分离卷积,下面给出本文所提出的总体架构:带有线性瓶颈的倒置残差结构。

在这里插入图片描述

2.3 MobileNetV2的网络结构

在这里插入图片描述

3. 实验结果

3.1 ImageNet 分类

3.2 目标检测

文章基于所提出的MobileNetV2架构,提出了SSDLite网络,该网络是将MobileNetV2和SSD结合。

3.3 语义分割

文章基于所提出的MobileNetV2架构,提出了Mobile DeepLabv3网络,该网络是将MobileNetV2用作特征提取,将DeepLabv3用作头。在PASCAL VOC 2012上进行实验。结果如下:

在这里插入图片描述

3.4 消融实验

在这里插入图片描述

4. 结论

残差块中最后一个卷积后不要加ReLU,可以减小特征损失。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-03-11 22:11:31  更:2022-03-11 22:13:40 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 15:39:42-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码