| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> Non-Local Neural Networks -> 正文阅读 |
|
[人工智能]Non-Local Neural Networks |
一.摘要卷积操作和循环神经元操作都是建立了一个处理一个局部范围信息的一个过程.本文呈现了一种非局部(non-local)操作,可以作为用于捕获长范围依赖的一类模块.本文提出的non-local操作在计算feature map上某点的响应值时就是通过对feature map上所有点与当前点的关系加权求和的一个结果.本文提出的non-local模块可以插入到许多计算机视觉网络结构中并取得不错的效果. 二.Non-Local Neural Networks接下来首先给出non-local操作的定义,然后给出几个具体的non-local的实例. 2.1公式定义通用的non-local操作如下公式所示: 对于上式子non-local操作的通用定义有如下解释: (1) (2) (3) (4)位置 (5) (6)函数 (7)函数 (8)non-local的位置 通过定义可以看出,非局部(non-local)操作在计算点 上式中的non-local操作与全连接操作是不同的,non-local操作是对所有位置 non-local操作可以灵活并容易的应用于卷积/循环神经网络.并且non-local操作可以使用在网络的浅层,不像全连接层只能应用于网络末端.这就能够建立更加丰富的层级,从而结合局部和非局部信息. 2.2实例尝试了多种不同的 为了简化,本文将 接下来具体讨论不同形式的 高斯将 这里 编码后高斯对于上面的高斯函数进行进一步的扩展,将原始输入 ? 以上两种? 其中 但需要注意,这并不是本文提出的non-local操作,只是自注意力操作,因为其缺少了求和那一步(在上式子中最左端加入求和符号便是本文的non-local操作).因此本文通过将自注意力和非局部均值方法想结合提出了本文的non-local操作. 随后本文发现由softmax操作进行attention操作并非是必须的,接下来给出2种non-local操作的可替换版本. 点积
这里采用对输入编码后的结果的点积相似度.与前两种方式不同的是,这里归一化因子 拼接
? 式中 2.3Non-Local模块上图为一个时空(3维数据,例如视频流)的non-local模块整体架构图,其中non-local操作选用的 这部分将介绍non-local模块的构造,non-local模块将前文提到的non-local操作包括在内,non-local模块能够应用于许多当前的网络结构中.本文定义non-local模块的数学表示如下所示: 式子中 当输入特征是高级别(深层特征)并降采样的feature时,non-local模块中的 Non-Local模块的实现对输入 还有另一个降采样操作去减小non-local操作的计算量,首先将2.1中non-local操作的公式重新写为如下形式: 式子中 三.试验结果下面为论文中一部分实验的结果数据: 上图中实例a表示在C2D模型中插入一个non-local模块,但是基于上文中提到的四种不同的 表b展示了分别对基于ResNet50和ResNet101的C2D插入不同数量的non-local模块的实验结果,基于ResNet50的C2D插入10个non-local模块效果最好,基于ResNet101的插入5个和10个non-local模块效果最好. 表d展示了分别在ResNet50以及ResNet101中,分别在时间,空间以及时空维度插入5个non-local模块的结果,发现ResNet50与ResNet101中均在时空维度下插入效果最好. |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年2日历 | -2025/2/21 19:46:57- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |