[人工智能] Inception模块 GooLeNet网络

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> Inception模块 GooLeNet网络 -> 正文阅读

[人工智能]Inception模块 GooLeNet网络

GoogLeNet

? 这篇文章打算简单总结一下GoogLeNet网络，其网络结构如下图所示。

? 我放上面这张图只是为了方便我们大致了解一下它的结构。我知道这样肯定不太能看清每一层具体细节，因为可以发现，GoogLeNet看起来有非常多且复杂的结构，要是清晰地放在这篇文章里恐怕会占很多篇幅，所以具体、清晰的GoogleNet图可以看这里。

? 与VGG、AlexNet等卷积神经网络相比，GoogLeNet绝对是我们见过的层数最多的网络了，它的网络层数有超过100层。

Inception

? 我们说GoogLeNet足有100多层，然而从图中可以发现，从左到右，似乎深度并没有到100层。这并不矛盾，我们说神经网络的层数并不一定等同于深度，那么这个网络是如何达到100多层的呢？是通过并行的方式。

? 这就在于GoogLeNet中的inception块。我们通过GoogLeNet的网络图，可以发现里面有很多并行的结构。在整理ResNet网络的时候，我们发现网络除了直接送入卷积层之外，还可以额外进行残差边的额外送入，也就是说，同一个数据可以并行地分两条路去走。而GoogLeNet中的inception块就更加“放肆”了：有的进行卷积，有的进行池化，卷积核的大小也有不同，这样开设四条路径（一般来说），然后在输出通道维合并。

? 如上图，是早期inception块的基本思路。我们对于某一层的输出，进行四条路径下不同的处理，有1*1卷积、3*3卷积、5*5卷积以及3*3池化等操作，再最终将结果合并到一起。这就是最早期inception块的思路了，理解起来并不难。

? 然而，深度神经网络需要耗费大量计算资源，我们虽然采取了多种方式进行融合，但必然会大大增加计算量。还记得1*1卷积的作用吗 ??后面inception块为了减少计算量，在不同通道下都引入了1*1的卷积来减少通道数，从而减少参数量。这就有了下面更加常见的inception块：

? 如上图，为了降低算力成本，我们在3*3和 5x5 卷积前都增加了1*1卷积来减少输入卷积层的通道数。这样就可以减少卷积层的参数量了。因为卷积层的参数量为：输入层通道数*输出层通道数*卷积核大小。（这里一定要理解哈，因为输入层通道数决定了卷积核的通道数，输出通道数决定了卷积核的个数）

? 因此，虽然我们看似是额外增加了几个1*1的卷积层，然而因为卷积层参数以及各个地方通道数的减少（得益于1*1卷积的大量使用），我们整体的参数量和复杂度是有减少的。整个inception块，也就是四条道路相融合的参数量甚至要少于单纯进行3*3或5*5的卷积！inception的优点之一也就是模型参数小，计算复杂度低。

? 值得注意的是，对于卷积层，1*1卷积会出现在卷积层之前来及时减少输入的通道数；而对于池化层，1*1卷积是出现在最大池化层之后的。

Inception的通道数和尺寸

? 因为inception有一个非常重要的性质：虽然输出通道数会因为四个路径相加而比输入通道数多，但是输出尺寸大小和输入尺寸是一样的。即：通过一个inception，高宽不变，通道数改变。

? 上图中我还额外标记了padding的大小，一个pad=1，另一个pad=2，这两处padding是本来就有的只不过原图中没显示。因为如果这两处卷积如果不设padding的话，是不可能使尺寸不变的。

? 之前在这篇文章（https://blog.csdn.net/weixin_44492824/article/details/123080291）中有过结论：

? 卷积核尺寸为3*3，padding=1，步长为1，卷积后尺寸不变
? 卷积核尺寸为5*5，padding=2，步长为1，卷积后尺寸不变

? 所以图中其实3*3卷积padding是1，5*5卷积padding是2，才可以保持尺寸大小不变，才符合inception块的性质。

? 通道数的保留和占比也是有一些说法的，比如对于3*3的卷积，我们认为它更加重要，所以第二条路线我们给他更多的通道数，而5*5的卷积与池化层相对来说不是那么重要，所以第三、四条路线我们分别通过5*5和1*1的卷积来将它压缩至较小的通道数。

关于其他inception变种等

? 其实inception块在我理解看来就是开启多个不同的“并行路线”，每个路线采用不同的方式进行特征提取和学习，我们当然也可以让某一个路线直接变成残差边，或者是改变一些卷积核的大小、个数，或者加入BN层等，因此后面对于inception的变种也都是在这些思路上进行了改变。目前inceptionv3以及v4就是做了以上相关的改进，效果还是不错的。

? 关于inception我感觉就了解即可，不同版本其实也就是inception模块的一些改变和调整。要想复现GoogLeNet的话，模型构建以及训练起来还是很麻烦很慢的。一方面，是因为GooLeNet不同stage使用inception块的方式也都比较“无厘头”，并且很多通道数的设定也比较玄学；另一方面，虽然我们说inception块可以减少一些参数量，但是架不住它数目太多，因此整体结构还是复杂的。

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

加:2022-03-21 20:50:48 更:2022-03-21 20:55:30

360图书馆购物三丰科技阅读网日历万年历 2026年4日历

-2026/4/24 10:36:14-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码