IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 特征金字塔(FPN) -> 正文阅读

[人工智能]特征金字塔(FPN)

论文:《Feature Pyramid Networks for Object Detection》

主要内容

建立一个自上而下的途径和横向连接,将低分辨率、语义强的特征与高分辨率、语义弱的特征相结合的特征金字塔,在各个层面都有丰富的语义,并能从单一的输入图像比例中快速构建。该方法将任意大小的单尺度图像作为输入,并以完全卷积的方式在多个层次上输出不同比例大小的特征图。这个过程独立于骨干卷积架构

在这里插入图片描述

FPN结构

自下而上的途径

自下而上的途径是骨干网络的前馈计算,它计算的特征层次由几个尺度的特征图组成,缩放步长为2。通常有许多层产生相同大小的输出图,我们说这些层处于同一网络阶段。对于我们的特征金字塔,我们为每个阶段定义一个金字塔层。我们选择每个阶段最后一层的输出作为我们的特征图参考集,我们将充实这些特征图来创建我们的金字塔。这种选择是很自然的,因为每个阶段的最深层应该有最强的特征。
例如ResNet网络,有四个卷积块,表明有四个不同大小的特征图输出。这是主干网络提供的,FPN结构直接拿来用。舍弃第一个卷积因为他需要太大的内存

总结:
在自下而上的途径中,FPN只获取特征图尺寸发生变化的输出,并且这个输出是特征图尺寸发生变化前的最后一个输出

自上向下的路径和横向连接

自上而下的途径通过对来自金字塔高层的空间上较粗但语义上较强的特征图进行上采样,幻化出更高的分辨率特征。然后,这些特征通过横向连接与来自自下而上途径的特征一起增强。每个横向连接将来自自下而上途径和自上而下途径的相同空间大小的特征图合并起来。自下而上的特征图具有较低的语义,但由于其被子采样的次数较少,其激活的定位更为准确。
下图是自上而下特征图的结构。对于较粗分辨率的特征图,我们将空间分辨率上采样2倍(为简单起见,使用近邻上采样)。然后,上采样的特征图与相应的自下而上的特征图(经过1x1个卷积层以减少通道尺寸)通过元素相加的方式合并起来。这个过程反复进行,直到生成最精细的分辨率地图。为了开始迭代,我们只需在C5上附加一个1x1卷积层以产生最粗的分辨率地图。最后,我们在每个合并的特征图上附加一个3x3卷积层,生成最终的特征图,这是为了减少上采样的混叠效应。
因为金字塔的所有层次都使用共享的分类器/回归器,就像传统的特征图像金字塔一样,我们在所有的特征图中固定了特征维度(通道数,表示为d)。在本文中,我们设定d=256,因此所有额外的卷积层都有256通道的输出。在这些额外的层中没有非线性,我们根据经验发现这些非线性的影响很小。
在这里插入图片描述
总结:
将自上而下的特征图和相对应的自下而上的特征图通过逐像素相加的方式融合,在最粗的分辨率中,使用1个1x1的卷积来调整通道数,文中默认将通道数设置为256,对较粗的分辨率用近邻采样法进行2倍上采样(特征尺寸*2)。对于横向连接部分,直接使用1个1x1的卷积层来调整通道数。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-10-31 11:56:46  更:2022-10-31 12:01:03 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/25 21:43:04-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码