| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> SiamMOT:Siamese Multi-Object Tracking论文详读 -> 正文阅读 |
|
[人工智能]SiamMOT:Siamese Multi-Object Tracking论文详读 |
一、摘要1.本文工作主要是针对SiamNet-base object tracking的优化改进 2.SiamMOT在SiamNet-base object tracking的基础上加入了一个运动模型,并证明了加入运动模型的必要性 3.该运动模型分为隐式建模(IMM)运行和显式建模(EMM)两种 4.在MOT17、TAO-person以及Caltech Roadside Pedestrians三个数据集上证明了运行建模对于MOT任务的必要性,并表明SiamMOT取得了SOTA 5.SiamMOT同时也是efficient的,在单GPU输入720P的视频能达到17FPS 二、Introduction中提出的一些观点1.把早期的跟踪工作描绘为一个在tracking-by-detection”范式(paradigm)基础下的基于图的优化问题(graph-based optimization problem) 2.之前的工作通常需要构建一个很大的离线图,所以很不适用于实时系统 3.近期也出现了一些实施跟踪的工作,专注于改进连续帧上的本地链接,而不是构建离线图来重新识别跨越大的时间间隔的实例 4.作者认为在SORT中一个较好的运行模型是提高其局部连接精度的关键 三、方法论和试验结果先知方法1.使用基于区域的暹罗网络(region-based Siamese Network),其中“基于区域”的说法来自region- 2.此外在基于暹罗网络的单目标跟踪任务的启发下,提出了IMM和EMM两种运动建模方法 试验结果1.证明:在三个不同的多人跟踪数据集进行了广泛的消融分析后的结果表明,实例级运动建模对于健壮的在线MOT非常重要,特别是在更具挑战性的跟踪场景中。 2.在MOT17数据集上以DLA-34为backbone的、带有EMM的、使用公共检测(public detection)的SiamMOT实现了65.9的MOTA和63.3的IDF1 3.最近的TAO-person数据集的TrackAP指标从Trackor++的36.7提升至了41.1 4.Human In Events(HiEve)数据集上取得了最好的结果? 四、变量声明先对整体框架有个大致的了解,便于了解“运动建模”这部分的位置 参数解读一下吧,对这个过程基本就能了解了 图1:SiamMOT是一个基于区域的多目标跟踪网络,可同时检测和关联对象实例。暹罗跟踪器对跨帧的实例运动进行建模,用于在线多目标跟踪中的临时链接检测。帧的主干特征图以其实际大小的1/2可视化。? 输入:和分别表示两个时刻的帧 表示时刻一系列的检测实例(instances)(即是box) 输出:输出的是由和经空间匹配后经求解器求解出的 过程量:是跟踪器将传播到时刻产生的 过程量的表示对时刻输入帧预测的一系列实例(instances)(即是box)(注意这里的有两个,一个是输出量,一个是过程量) 为区域提议 为过程特征图 Siamese Track?在整个框架中表示的是一个跟踪过程,其实它就是我们接下来要重点提到的运动建模部分,如下原文 五、对主要创新点-两种运动建模的解读统一形式建立一个统一的形式: 这段就不翻译了,我觉得原汁原味的英语更容易理解 1. Implicit motion model隐式运动模型使用MLP隐式估计两帧之间的实例级运动,如图 IMM通过将特征和按通道连接在一起后送入MLP中预测可见置信度以及相关位置及范围变化,定义为下式,其中的为目标box的4个参数: 利用这些便可从方程的逆变换中很容易地推导出 使用的loss形式为,其中的为指示函数(indicator function) 2. Explicit motion mode注意理解显式和隐式的根本差别,显式运动建模的流程如图 可以看到主要利用的是逐通道互相关操作(*表示),具体来说是通过逐通道互相关操作来生成像素级别的特征响应图。 因此,我们可以通过以下变换导出(x, y)处的实例区域:,其中,也就是左上角和右下角的偏移量。 最后的运动估计就可表示为: 其中⊙是逐个元素的乘法,是指定相应候选区域的非负惩罚分数的惩罚映射,由计算得到。其中为高斯函数,负责评价和的相关性。是关于之前目标区域的几何中心一个余弦窗函数。 损失函数形式为: |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/10 20:19:22- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |