| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 【深度学习】论文阅读:(ICCV-2021))Segmenter:Transformer for Semantic Segmentation -> 正文阅读 |
|
[人工智能]【深度学习】论文阅读:(ICCV-2021))Segmenter:Transformer for Semantic Segmentation |
0.详情名称:Segmenter:Transformer for Semantic Segmentation 1.创新点1)提出了一种基于 Vision Transformer 的语义分割的新颖方法,该方法不使用卷积,通过设计捕获上下文信息并优于基于 FCN 的方法; 2)提出了一系列具有不同分辨率级别的模型,允许在精度和运行时间之间进行权衡,从最先进的性能到模型具有快速推理和良好性能的模型; 3)提出了一种基于 Transformer 的解码器生成类掩码,其性能优于我们的线性结构,并且可以扩展以执行更一般的图像分割任务; 4)证明了此方法在 ADE20K 和 Pascal Context 数据集上产生了最先进的结果,并且在Cityscapes 上具有竞争力。 2.Abstract在进行图像语义分割时,图像被编码成一系列补丁后往往很模糊,需要借助上下文信息才能被正确分割。 我们利用预先训练的图像分类模型,并表明我们可以在中等大小的数据集上对其进行微调,以进行语义分割。线性解码器已经可以获得很好的结果,但是通过生成类掩码的掩码转换器可以进一步提高性能。我们进行了广泛的消融研究,以显示不同参数的影响,尤其是对于大型模型和小面积贴片,性能更好。Segmenter在语义分割方面取得了很好的效果。它在 Ade20K 和 Pascal 上下文数据集上都优于最先进的技术,在城市景观数据集上具有竞争力。 3.MothodSegmenter完全基于transformer的编解码器体系结构,利用了模型每一层的全局图像上下文。
指先添加patch embedding 跑一次transformer,再添加class embedding 跑一次transformer; 3.1 Encoder一幅图像 x ∈ R(H×W×C)被分割成一系列补丁 x = [x1, …, xN] ∈ R(N×P2×C),其中 (P, P) 是补丁大小,N 是补丁的数量,C 是通道的数量 每一块补丁扁平化成一维向量,然后线性投影到补丁嵌入以产生补丁嵌入序列 x0 = [Ex1, …, ExN] ∈ R(N×D), 由 L 层组成的 Transformer 编码器将具有位置编码的嵌入式补丁的输入序列 z0 = [z0,1, …, z0,N] 映射到 zL = [zL,1, …, zL,N],这是一个上下文化编码序列,包含解码器使用的丰富语义信息 3.2 Decoder将补丁编码序列 zL 解码为分割图 s ∈ R(h × w × k),其中 k 是类的数量。 Linear Mask Transformer 然后将每个掩码序列重构为2D掩码,形成smask∈RH/P ×W/P ×K,并对其进行双线性上采样到原始图像大小,得到特征图s∈RH×W ×K。然后将softmax应用于类维,然后是层范数,以获得像素级类分数,形成最终的分割图。 4.Conclusion本文介绍了一种纯transformer的语义分割方法。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 8:31:36- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |