ReID定义
ReID:person re-identification,行人重识别旨在,非重叠视角域多摄像头下进行的行人匹配,确定不同位置的摄像头在不同时刻拍摄到的行人目标是否是同一人。ReID对公共安全和刑侦是非常现实的意义,比如说安防、人员追踪等。但是呢,因为拍摄得到的图像分辨率低、视角变化、姿态变化、光线遮挡等问题,导致ReID的研究受阻。
ReID实现过程
ReID是一个检索任务,所以首先需要做的就是检测,将摄像头拍摄到的行人图像中的行人用方框框出来,并进行标注,得到数据集(在具体的数据集中,每个图像中都只包含了一个行人)。之后使用特征提取网络对特征进行提取,计算特征之间的度量距离得到损失值,使用优化器更新网络参数,使模型的损失值最小。最后在模型测试时,将所要检索的图像(probe数据集)在gallery数据集中进行比对,计算出特征距离,并按从小到大顺序排序,选出top-k的几张图像,达到检索的目的。训练阶段和测试阶段的流程图如下:
?
?(ReID中使用的数据集名称:training set就是用户训练模型的数据;gallery set和probe set都是在测试时使用的数据集,具体地,gallery set指的是参考图像集;probe set指的是测试图像集,并且probe set中的数据不在training set中)
ReID数据集与评价指标
数据集:
1. Market-1501
2. DukeMTMC-reID
3. CUHK03
评价指标:
1. CMC:累计匹配曲线,这个曲线是由accuary和top K组成,其实就是在计算top K的命中概率,这样能够反映出分类器的效果 2. top K:表示按照相似度进行排序,第一个相似度最高的为正确类别 3. mAP:平均准确率
NAS定义
神经架构搜索(Neural Architecture Search,简称 NAS)的核心思想是使用搜索算法来发现用于解决我们的问题所需要的神经网络结构,也就是通过NAS找到最优的网络结构。对于深度学习而言,对训练参数的调优称为超参数优化;对于NAS而言,就是对网络结构的参数(比如卷积层、池化层等)进行调优。NAS结构组成分为搜索空间、搜索策略、性能评估策略。搜索空间就是一个候选网络结构的集合。(对NAS这方面我也不是很清楚,建议看看别的博客)
后续
后面会对NAS中的DARTS模型进行记录,然后再把NAS-ReID结合的4篇论文做一个简单的总结。
参考博客:
小白入门计算机视觉系列——ReID(一):什么是ReID?如何做ReID?ReID数据集?ReID评测指标?_贝壳er的博客-CSDN博客_reid数据集
神经架构搜索(NAS)综述 - Someday&Li - 博客园
|