| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 我对Swin Transformer V2的理解 -> 正文阅读 |
|
[人工智能]我对Swin Transformer V2的理解 |
Swin Transformer V2: Scaling Up Capacity and Resolution 一、前言1.综述本文提出一种升级版SwinTransformerV2,最高参数量可达3 Billion,可处理大尺寸图像。通过提升模型容量与输入分辨率,SwinTransformer在四个代表性基准数据集上取得了新记录。 2.要解决的问题
3.改进方案
二、方法1.A Brief Review of Swin TransformerNormalization Configuration 众所周知,规范化技术对于更深架构的训练非常重要。原始的SwinTransformer采用了常规的预规范化技术,见下图:
2.Scaling up Model Capacity
Scaled Cosine Attention 在原始自注意力计算过程中,像素对的像素性通过query与key的点积计算。我们发现:在大模型中,某些模块与head的注意力图会被少量像素对主导 。为缓解该问题,我们提出了Scaled Cosine Attention(SCA),公式如下: 3.Scaling Up Window Resolution接下来,引入一种log空间连续位置偏置方法以使得相对位置偏置跨窗口分辨率平滑迁移。 Continuous Relative Position Bias 不同于直接对偏置参数直接优化,连续位置偏置方法采用了针对相对坐标的元网络: Log-space Coordinates 当跨大窗口迁移时,有较大比例的相对坐标范围需要外插。为缓解该问题,采用了对数空间坐标: 4. Implementation to Save GPU Memory大分辨率输入与大容量模型存在的另一个问题是GPU显存占用不可接受问题 。
5. Model Configurations本文保持与SwinTransformer相同的stage、block以及通道配置得到了四个版本的SwinTransformerV2: T(Tiny),S(Small),B(Base),L(Large) SwinV2-T: C=96, layer number= {2,2,6,2} SwinV2-S: C=96, layer number= {2,2,18,2} SwinV2-B: C=128, layer number= {2,2,18,2} SwinV2-L: C=192, layer number= {2,2,18,2} 我们进一步对SwinV2进行更大尺寸缩放得到了658M与3B参数模型: SwinV2-H: C=352, layer number={2,2,18,2} SwinV2-G: C=512, layer number={2,2,42,2} 三、实验结果本文主要在ImageNetV1、ImageNetV2、COCO检测、ADE20K语义分割以及Kinetics-400视频动作分类方面进行了实验。
Reference: |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 | -2024/12/28 19:43:19- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |
数据统计 |