| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 【论文阅读】CVPR 2020 《Strip Pooling: Rethinking Spatial Pooling for Scene Parsing》 -> 正文阅读 |
|
[人工智能]【论文阅读】CVPR 2020 《Strip Pooling: Rethinking Spatial Pooling for Scene Parsing》 |
源论文https://arxiv.org/pdf/2003.13328v1.pdfhttps://arxiv.org/pdf/2003.13328v1.pdf 源码https://github.com/Andrew-Qibin/SPNethttps://github.com/Andrew-Qibin/SPNet 目录 Introduction最近,基于全卷积网络(FCN)的方法凭借其捕获高级语义的能力在场景解析方面取得了非凡的进步。 但是,这些方法大多会叠加局部卷积和池化操作,因此,由于有效视场有限,因此很难很好地应对具有多种不同类别的复杂场景。
在本文中,为了更有效地捕获远程依赖关系,进一步研究使用池化来扩大CNN的接收域并收集信息上下文,并提出了条形池化的概念。 作为全局池的替代方法,条形池化具有两个优点。 首先,它沿一个空间维度部署了长条的核,因此可以捕获孤立区域的长期关系。 其次,它沿其他空间维保持窄的内核形状,这有助于捕获本地上下文并防止无关区域干扰标签预测。 集成了如此长而狭窄的内核,使得场景解析网络可以同时聚合全局和局部上下文。 这与传统的从固定的正方形区域收集上下文的池化本质上是不同的。
? Model1、Strip Pooling Module(SPM)?池化常用来捕获大范围的上下文信息,传统池化内核尺寸为N*N,而本文提出的条形池化的内核尺寸为1*N和N*1。即是池化的kernel大小为1 ? H , W ? 1 ,垂直与水平方向可以表示为: ? 在得到上面的池化结果之后会将得到的特征使用一个1D的卷积进行调和,之后就是在各自的方向上进行扩展,使其与先前的特征图大小一致,再将两个特征图进行融合: 之后,经过sigmoid激活与原特征图进行点乘得到最后的结果。如下图: ?主要流程:
2、Mixed Pooling Module(MPM)文章中提出的MPM模块(包含两个子网络,长依赖与短依赖)与之前的PPM模块进行比较有3点不同的地方:
Experiment? ? ? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/12 3:55:57- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |