| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> IJCAI-2021- TransT: Transformer Tracking 阅读笔记 -> 正文阅读 |
|
[人工智能]IJCAI-2021- TransT: Transformer Tracking 阅读笔记 |
论文地址: 目录创新点: 利用Transformer的核心思想,设计了一种新的基于注意的网络,在不使用任何相关操作的情况下直接提取和搜索区域特征。 一、 动机互相关操作本身是一个局部线性匹配过程,容易丢失语义信息,陷入局部最优,这可能是设计高精度跟踪算法的瓶颈。为了寻找比比互相关更好的特征融合方法,本工作受到Transformer的启发,提出了一种新颖的基于注意的特征融合网络,该网络仅利用注意有效地结合了模板和搜索区域特征。 二、 主要贡献① 提出了一种新的Transformer跟踪框架,包括特征提取、变压器类融合和头部预测模块。变压器类融合将模板和搜索区域特征单独使用注意,而不需要相关性。 三、 主要内容1、什么是Transformer ?Transformer最初是由Vaswani等人提出的。论文地址 2、TransT网络架构:
① Feature Extraction.特征提取骨干网络使用ResNet50的改进版本进行特征提取。也就是去掉ResNet50的最后一个阶段,将第四阶段的输出作为最终输出。除此之外还将第四阶段下采样单元的卷积步长由2改为1,以获得更大的特征分辨率。第四阶段的3×3 卷积也修改为步长为2的扩张卷积,以增加感受野。 ② Feature Extraction.首先,由一个1×1卷积对fz和fx的通道维数进行降维,得到两个低维特征图fz0和fx0,使维度降低到256。
Ego-Context Augment and Cross-Feature Augment Modules自我上下文增强模块和交叉特征增强模块A、 Multi-head Attention.注意力是设计特征融合网络的基本组成部分。给定queries Q, keys K和values V,注意函数为尺度点积注意,定义于式(1)。
B、 Ego-Context Augment (ECA).
其中Px∈Rd×Nx为空间位置编码,XEC∈Rd×Nx为ECA的输出。 C、 Cross-Feature Augment (CFA).CFA采用多头交叉注意的残差形式融合两个输入的特征向量。与ECA相似,空间位置编码也被用于CFA。此外,采用FFN模块增强模型的拟合能力,该模型是由两个线性变换组成的全连接前馈网络,即: D、 Differences with the original Transformer我们的方法借鉴了Transformer的核心思想,即采用注意机制。但是我们没有直接采用DETR中的Transformer结构。相反,我们设计了一个新的结构,使其更适合于跟踪框架。该方法的交叉注意操作比DETR更重要,因为跟踪任务的重点是融合模板和搜索区域特征。 E、 Differences with the original Transformer为了探索注意模块在我们的框架中是如何工作的,我们在一个具有代表性的跟踪片段中可视化了所有注意模块的注意地图,如图4所示,以查看注意力想要看到什么。我们用数字n(1≤n≤4)表示当前融合层的数目。共四层,融合层从左到右越深。最后一次交叉注意得到最后一次单注意映射,用于解码。 ③ Prediction Head Network.预测头由一个分类分支和一个回归分支组成,每个分支是一个具有隐藏层d和ReLU激活函数的三层感知器。对于特征融合网络生成的特征图f∈Rd×HxWx,头部对每个向量的前/背景分类结果进行预测,并对搜索区域大小的坐标进行预测。我们的跟踪器直接预测标准化坐标,而不是调整锚点或锚盒,基于先验知识直接丢弃锚点或锚盒,从而使跟踪框架更加简洁。 ④ Training Loss预测头接收Hx×Wx的特征向量,并输出分类和回归结果。我们选择ground-truth包围框中像素对应的特征向量的预测为正样本,其余为负样本。所有样本都对分类损失有贡献,而只有正样本对回归损失有贡献。为了减少正样本和负样本之间的不平衡,我们将负样本产生的损失降为1 / 16。我们采用标准二元交叉熵损失进行分类,定义为: 四、 实验结果训练数据集:COCO、TrackingNet、LaSOT和GOT10k |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/10 20:41:38- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |