| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 带你读论文系列之计算机视觉--GoogLeNet V3 -> 正文阅读 |
|
[人工智能]带你读论文系列之计算机视觉--GoogLeNet V3 |
带你读论文系列之计算机视觉–GoogLeNet V3
闲谈广东的天气异常热,重庆今日温度28度左右,而广东37度左右。九月的天,让我又进入的夏天😭。近期会频繁更新,原因是我假期太懒了,都是之前累积的论文,现在开始整理了。同时,我把相关文档整理一下,放在我的GitHub上,欢迎加星, 欢迎提问,欢迎指正错误, 同时也期待能够共同参与。 前言重新思考计算机视觉中的Inception结构。 回顾
GoogLeNet –V1 采用多尺度卷积核,1??1卷积操作,辅助损失函数,实现更深的22层卷积神经网络,夺得ILSVRC-2014 分类和检测冠军,定位亚军。 GoogLeNet-V2 基础上加入BN层,并将5*5卷积全面替换为2个3??3卷积堆叠的形式,进一步提高模型性能。 VGG网络模型大,参数多,计算量大,不适用于真实场景。 GoogLeNet比VGG 计算量小;GoogLeNet可用于有限资源下的场景。 论文: 研究意义:
论文详情本文优点: GoogLeNet的Inception 架构也被设计为即使在内存和计算预算的严格限制下也能表现良好。例如,GoogLeNet仅使用了500 万个参数,相对于其前身AlexNet使用了6000万个参数,这意味着减少了12 倍。此外,VGGNet使用的参数比AlexNet多3倍。 摘要:
大卷集合分解成小卷积核堆叠。取代5×5卷积的小型网络。 解耦:
分解成更小的卷积:
具有较大空间滤波器(例如5×5或7×7)的卷积在计算上往往不成比例地昂贵。例如,在一个有过滤器的网格上用5×5个过滤器进行卷积,比用同样数量的过滤器进行3×3卷积的计算成本高25/9=2.78 倍。当然,5×5的滤波器可以捕捉到前几层中更远的单元的激活信号之间的依赖关系,所以减少滤波器的几何尺寸是以很大的扩展性为代价的。 如果我们放大5??5卷积的计算图,我们会看到每个输出看起来像一个小的全连接网络,在其输入上滑动5??5块(如上figure 1)。由于我们正在构建视觉网络,因此利用平移不变性似乎很自然再次将全连接组件替换为两层卷积架构:第一层是3×3卷积,第二层是第一层3??3 输出网格顶部的全连接层(如上figure 1)。在输入激活网格上滑动这个小网络归结为用两层3??3卷积替换5??5 卷积(如上figure 4 和 figure 5)。
通过使用不对称卷积,例如n??1,我们可以做得比2×2更好。例如,使用3??1卷积,然后再使用1??3卷积,就相当于用3??3 卷积的相同感受场滑动一个两层网络(见图3)。如果输入和输出滤波器的数量相等,在输出滤波器数量相同的情况下,两层的解决方案仍然便宜33%。相比之下,将3??3卷积分解为2??2 卷积只节省了11%的计算量。
两个Inception模型之间的实验,其中一个使用分解为线性+ReLU layers,另一个使用两个ReLU层。经过386万次操作,前者稳定在76.2%,而后者在验证集上达到77.2%t op-1准确率。
辅助分类器的效用
V1中提到的辅助分类层有助于低层特征提取的假设是不正确的。 本文认为辅助分类起到正则的作用。如果辅助分支是批量归一化的或具有dropout层,则网络的主分类器性能更好。这也为批量归一化充当正则化器的猜想提供了微弱的支持证据。 左图表示传统的池化方法,会损失特征图的信息,右图表示先将特征图增大再进行池化的过程,存在问题是计算亮过大; 解决办法:用卷积得到一半的特征图,池化得到一半的特征图,再进行拼接。
Inception模块,在扩展滤波器组的同时减小网格大小。它既便宜又避免瓶颈。右图表示相同的解决方案,但从网格大小而不是操作的角度来看。 实验
single-model、multi-crop实验结果比较对各种影响因素的累积影响。将我们的数字与ILSVRC2012分类基准上发布的最佳单模型推理结果进行比较。 比较multi-model、multi-crop报告结果的集成评估结果。我们的数字与ILSVRC 2012分类基准上发布的最佳集成推理结果进行了比较。*所有结果,但报告的前5个集成结果都在验证集上。集成在验证集上产生了3.46%的top-5错误。 论文总结Inception-V3的主要改进点:
关键点:
启发点:
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 14:40:49- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |