| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 【论文阅读】GaitSet: Regarding Gait as a Set for Cross-View Gait Recognition -> 正文阅读 |
|
[人工智能]【论文阅读】GaitSet: Regarding Gait as a Set for Cross-View Gait Recognition |
GaitSet: Regarding Gait as a Set for Cross-View Gait Recognition论文信息: 作者:Hanqing Chao, Yiwei He, Junping Zhang, Jianfeng Feng,复旦大学 AAAI 2019 也是步态识别方向的突破性大进展之一,用步态集合取代了之前广为使用的步态能量图GEI等 摘要本文提出的GaitSet,从集合中识别行人信息。从集合的视角,就可以不受到画面排列的影响,将不同场景下拍摄的不同视频的画面自然整合在一起,比如不同的角度,不同的穿着和携带物品等。在CASIA-B和OU-MVLP步态数据集上都取得了最好的效果。 Intro现有的步态识别方法:
本文提出的方法是把步态看成一个步态轮廓的集合,作者的逻辑是这样的:步态可以在一个简单的周期中被表示,在一个周期内,即使轮廓的外貌被打乱,实际上我们也仍然可以通过轮廓外貌进行重新排序。这样步态序列的位置信息就不需要了,因为轮廓本身已经包含了顺序信息。 模型的输入是一个步态序列的集合,首先,使用一个CNN去提取帧级别的特征;之后,使用集合池化层去把帧级别的特征综合为一个集合级别的特征。因为这个操作是在高级别的feature map上而不是原始的轮廓上,因此可以比步态能量图等保存更多的时序和空间信息。最后,使用水平金字塔去把集合级别的特征映射到一个有区分度的空间内,以获取最终的表示。 模型特点:
GaitSet问题公式描述把gait作为一个集合,给定N个人的数据集 y i y_i yi? ,假设某个人的步态轮廓图服从分布 P i P_i Pi? ,一个人的或轮廓序列就可以被描述为 X i = { x i j ∣ j = 1 , 2 , … , n } X_i=\{x_i^j|j=1,2,…,n\} Xi?={xij?∣j=1,2,…,n} ,这里 x i j ~ P i x_i^j\sim P_i xij?~Pi? 。 在这个假设下,我们对于步态识别的任务可以描述为三个步骤: Set Pooling
SP的目的是综合步态信息在集合中,就是将维度(n,c,h,v)聚合成(1,c,h,v),将帧级别的特征转换为集合级别的特征,需要有两个约束条件:
为了满足约束不变性,SP需要在集合的维度利用一些统计函数,本文研究了max、mean、median. 以及两种连接上述三个统计函数的方法,1_1C是指1*1的卷积层,(4)是(3)的提高版本,因为可以从卷积层中学习到三个统计方法的权重。 另外还使用了注意力机制去提高SP的性能,这个结构可以集成到整个网络中去实现端到端训练,把原始的特征和经过1*1卷积之后的特征计算注意力,最后再在优化过的帧级别的feature map上经过一个max层即可。 Horizontal Pyramid Mapping文献中有把feature map分成条带以用于行人重识别任务,提到了HPP,它有4个规模,因此可以帮助深度网络处理局部和全局信息,本文将HPP的思想应用于步态识别任务中,这里放一个HPP: 但本文没有使用HPP中的卷积层,而是用了一个全连接层,共有S个规模,每一层有 2 s ? 1 2^{s-1} 2s?1 个条带,因此共有 ∑ s = 1 S 2 s ? 1 \sum_{s=1}^S2^{s-1} ∑s=1S?2s?1 个条带。之后使用在池化层使用全局池化和平均池化, f s , t ′ = m a x p o o l ( z s , t ) + a v g p o o l ( z s , t ) f_{s,t}'=maxpool(z_{s,t})+avgpool(z_{s,t}) fs,t′?=maxpool(zs,t?)+avgpool(zs,t?) ,最后一步是使用FC全连接层去将f’映射到有区分度的空间内(下图里没有FC)。这里每个尺度的不同条带描绘了不同空间位置的特征。 Multilayer Global Pipeline在大pipeline中的上面MGP部分,卷积网络的不同层有不同的感受野,集合级别的特征通过在不同层使用SP来提取,被相加之后放入MGP中。它的网络结构与卷积网络结构几乎相同。这里两路网络最后的HPM参数不会共享。 训练和测试【这里为了弥补我永远看不懂的损失函数,做个补充…
训练时的损失函数就是引用中所介绍的 测试使用的方法是,给定一个查询Q,检索gallery中所有与G。Q首先需要放入GaitSet网络中获取多尺度特征,然后将所有的特征连接到最终表示FQ中,在每个G上也应用相同的网络获得FG,最后使用欧氏距离将每个FQ与每个FG进行比较,计算排名第一的识别准确率。 实验
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 11:38:36- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |