| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 恒源云 (Gpushare)_Restormer:用于高分辨率图像重建的高效Transformer -> 正文阅读 |
|
[人工智能]恒源云 (Gpushare)_Restormer:用于高分辨率图像重建的高效Transformer |
文章来源 | 恒源云社区 原文地址 | Restormer 原文作者 | 咚咚 摘要
算法Overall Pipline
如上图所示,每个Transformer模块中包括MDTA和GDFN模块,接下来进行详细介绍。 MDTA(MULTI-DCONV HEAD TRANSPOSED ATTENTION)一般Transformer模块中的多头自注意力机制具有较大的计算量,在应用到高分辨率图像上是不合适的,所以该论文提出了MDTA模块。 有两个与众不同的方法:
公式如下: GDFN( GATED-DCONV FEED-FORWARD NETWORK)一般的Transformer模块中使用FN进行逐像素特征操作,扩展和减小通道数。 该论文与之不同,使用了(1)门控机制和(2)depthwise卷积 如上图所示,下分支是一个门控单元,用于获取每个像素点的激活状态,使用1×1卷积层来扩展通道数,再使用3×3depthwise卷积层和GELU生成gate map。 并与上分支进行点乘,公式如下: 各层的GDFN通过控制信息流来允许每个层次关注与其他层次互补的细微细节。也就是说,与MDTA相比,GDFN提供了一个独特的角色(专注于丰富上下文信息)。 PROGRESSIVE LEARNING另外,论文还提出了一种渐进式训练方法。 基于CNN的重建模型通常在固定大小的图像patch上进行训练。然而,在小裁剪patch上训练Transformer模型可能不会编码全局图像统计信息,从而在测试时在全分辨率图像上提供次优性能。 为此,论文采用渐进式学习的方式,在早期阶段,网络在较小的图像块上进行训练,在后期的训练阶段,网络在逐渐增大的图像块上进行训练。 通过渐进学习在混合大小的patch上训练的模型在测试时表现出更好的性能。 由于在大patch上进行训练需要花费更长的时间,所以会随着patch大小的增加而减少batch大小,以保持相同的训练时间。 实验Image Deraining Results Single-image Motion Deblurring Results Image Denoising Results Ablation Studies |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 5:43:59- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |