IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 深度不一定更好:12层ParNet 并行非深度网络架构实现了与目前SOTA模型相似的性能 -> 正文阅读

[人工智能]深度不一定更好:12层ParNet 并行非深度网络架构实现了与目前SOTA模型相似的性能

虽然人们普遍认为网络深度是当今深度学习 (DL) 模型高性能的原因,但增加深度也会带来诸如延迟增加和计算负担增加等缺点,这可能会阻碍 DL 的进展。 如果没有深度网络,是否有可能实现类似的高性能?

普林斯顿大学(Princeton University)和英特尔实验室(Intel Labs)的一个研究小组在最新发表的(Non-deep Networks)论文中提出了ParNet (Parallel Networks),这是一种新颖的非深度网络架构,其性能可与最先进的深度网络架构相媲美。

该团队将他们的研究贡献总结为:

  1. 首次证明,深度仅为 12 的神经网络可以在极具竞争力的基准测试中实现高性能(ImageNet 上为 80.7%,CIFAR10 上为 96%,CIFAR100 上为 81%)。
  2. 展示了 ParNet 中的并行结构如何用于快速、低延迟的推理。
  3. 研究了 ParNet 的缩放规则,并展示该缩放规则是有效的。

ParNet 的主要设计特点是它使用并行子网络或子结构(在论文中称为“streams”),以不同的分辨率处理特征。 来自不同streams的特征在用于下游任务的网络的后期融合。 这种方法使 ParNet 能够在只有 12 层的网络深度下有效运行(比 ResNet 模型低几个数量级)。

ParNet 的一个关键组件是它的 RepVGG-SSE,这是一个经过修改的 Rep-VGG 块,并带有一个专门构建的 Skip-Squeeze-Excitation 模块。 ParNet 还包含一个降低分辨率并增加宽度以实现多尺度处理的下采样块,以及一个融合多个分辨率信息的融合块。

在他们的实证研究中,该团队在包括 ImageNet、CIFAR 和 MS-COCO 在内的大规模视觉识别基准上,将提议的 ParNet 与最先进的深度神经网络基线(如 ResNet110 和 DenseNet)进行了比较。

结果表明,只有 12 层深度的 ParNet 能够在 ImageNet 上达到 80% 以上的 top-1 准确率,在 CIFAR10 上达到 96%,在 CIFAR100 上达到 81%。 该团队还展示了一个具有 12 层主干网络的检测网络,该网络在 MS-COCO 大规模对象检测、分割和字幕数据集上实现了 48% 的平均精度。

总体而言,该研究提供了第一个经验证据,证明非深度网络可以在大规模视觉识别基准测试中与深度网络竞争。 该团队希望他们的工作有助于开发更适合未来多芯片处理器的神经网络。

论文地址:arxiv:2110.07641

论文源码:https://github.com/imankgoyal/NonDeepNetworks

本文作者 :Hecate He

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-10-25 12:32:33  更:2021-10-25 12:32:57 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 8:31:08-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码