[阅读心得] 多目标跟踪经典论文——相关领域论文粗读整理
前言
本文目的在于搜集并整理自动驾驶领域MOT相关工作即相近领域的工作,用于拓展思路,充分理解自动驾驶领域多目标跟踪问题。
日志: 1.16:监控视角车辆跟踪工作粗读3篇
监控视角
A Strong Baseline for Vehicle Re-Identification
【论文】A Strong Baseline for Vehicle Re-Identification 【代码】https://github.com/cybercore-co-ltd/track2_aicity_2021 创新点: 提出了一种监控视角下的车辆REID网络,从数据、网络结构、损失函数三个层面对ReID网络进行设计。 为什么: 监控视角下,ReID网络在面对视角变换、部分遮挡、图像模糊和光线变化等情况时表现不够理想。数据方面,生成数据和真实数据之间的样本空间存在gap,现有方法不能很好地将二者的域融合,会导致训练的网络特征空间飘逸;结构方面,大部分REID仅仅使用pooling层进行多尺度信息融合,在推理阶段表现不好;损失函数方面,ReID网络大多使用triplet loss,但是这种损失对正负样本的利用率很低; 怎么做: 数据方面,提出一种正则化方法MixStyle,以消除生成数据和真实数据的gap;结构方面,利用多头attention机制学习更精细的特征;损失函数方面,将Triplet Loss换成了Supervised Contrastive Loss,提高训练效率;
VREID
【论文】Adversarially-trained Hierarchical Feature Extractor for Vehicle Re-identification 【代码】https://github.com/PS06/VReID 创新点: 提出了一种车辆REID网络,VReID,通过设计网络结构、推理逻辑和数据增强,能够输出更高质量的embedding 为什么: 首先,行人REID和车辆REID存在一定区别:行人之间的颜色着装等区别很大,很容易产生以区分的特征,而车辆相对来说比较相近,不易进行类内、类间区分训练;其次,环境变化和相机放缩会导致类内、类间匹配出错。 怎么做: 数据方面,通过生成对抗结构产生hard negative sample,以便网络更高效训练;网络方面,使用CNN提取网络+Attention提取不同尺度信息;推理结构设计上,不同于其他工作只用一个embeddings vector进行距离计算,VReID显式地将不同属性区分开,如颜色、形状、品牌等,更好地进行距离计算区分;
LMT-CH
【论文】A
创新点: 针对监控视角车辆“近大远小”的特性,基于色彩直方图和大幅度运动趋势的融合算法,提出一种车辆跟踪算法,LMT-CH 为什么: 在监控视角下,车辆和相机的距离很远,而且尺寸变化会非常大,导致目标车辆的特征信息损失严重。 怎么做: 通过颜色直方图和大幅度运动模型进行轨迹匹配,一定程度上环节上述问题。
|