| |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| -> 人工智能 -> FBNetV5——一种面向多任务的高效NAS方法 -> 正文阅读 |
|
|
[人工智能]FBNetV5——一种面向多任务的高效NAS方法 |
|
Paper地址:https://arxiv.org/pdf/2111.10007 前言网络结构搜索(NAS:Neural Architecture Search),主要的Motivation有两点:
但影响NAS方法可泛化、普遍应用的主要原因包括:
FBNetV5是沿袭FBNet系列的NAS方法,仅需一次搜索,便能够同时为不同的任务搜索相应的最佳网络结构:
NAS流程完成之后,需要在各自任务相关的数据集上,微调训练搜索获得的模型、以确保最佳精度。在ImageNet图像分类任务上,获得了与FBNetV3相近计算量、但精度高1.3%的模型结构;在ADE20K语义分割任务上,相比于SegFormer,所得模型的mIoU提升1.8%,计算量节省3.6x;在COCO目标检测任务上,相比于YOLOX,所得模型的mAP提升1.1%,计算量节省1.2x。 方法下图显示了FBNetV5的搜索空间设计与搜索训练流程,具备如下优势:
搜索空间基于FBNetV3-A模型,扩展了模型结构以构建超网络(Supernet),其中包含多个并行分支(Parallel paths)与多个阶段(Multiple stages),每个分支的特征图分辨率(Resolution)不同,但相同阶段的分辨率相同。第一个阶段为FBNetV3模型,并划分成4个部分(4 Partitions),降采样率分别为4、8、16与32倍。对于剩余的阶段,Building block构建为Partition的最后两个网络层(Last 2 layers of the partition)。当超网络包含P个分支、S个阶段时,待选择的Block choices有B=S*P个。另外,不同阶段之间会插入融合模块(Fusion modules)以融合来自不同Path的信息,并用Binary mask确定分支Block的连接或跳过。其中Stage0~1、以及Fusion module的结构示意如下:
所构建的搜索空间(Search space)具备如下三个优势:
多任务预训练搜索为了将NAS从目标任务的训练Pipeline中解耦开来,设计了Multi-task proxy training方法,以便于将NAS快速应用于不同的任务场景。并基于ImageNet与开源模型(本文为检测与分割模型,亦可借助其他模型扩展任务应用,从而确保Scalable),构建了Pseudo-labeled多任务数据集:
搜索算法FBNetV5基于可微分搜索策略(确保充分预训练与搜索效率;可微分搜索尽管搜索空间受限,但大、小网络并排训练,有助于增强预训练效果),设计了高效率的搜索算法(与任务数无关)。如下所示,从Algorithm-1到Algorithm-4算法改进,体现了对搜索效率的增益:
实验结果针对不同任务应用,网络结构搜索结果、以及与其他SOTA模型的对比如下:
|
|
|
|
|
| 上一篇文章 下一篇文章 查看所有文章 |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| 360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年11日历 | -2025/11/8 5:03:32- |
|
| 网站联系: qq:121756557 email:121756557@qq.com IT数码 |