| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 论文超详细精读|六千字:ST-GCN -> 正文阅读 |
|
[人工智能]论文超详细精读|六千字:ST-GCN |
前言笔者从人工智能小白的角度,力求能够从原文中解析出最高效率的知识。
总览首先,看完标题,摘要和结论,我了解到了以下信息:
一、Introduction背景与局限1.动态骨骼形态可以用人类关节位置的时间序列来表示,以2D或3D坐标的形式。然后,通过分析人类的运动模式,可以识别人类的行为。 解决问题思路1.神经网络解决自动问题。为了超越这些限制,我们需要一种新的方法,能够自动捕获嵌入关节空间配置中的模式以及它们的时间动态。然而,骨架是图形形式的,而不是2D或3D网格,这使得使用卷积网络等经过验证的模型变得困难。 新方法及主要贡献
二、Related workNeural Networks on Graphs(图神经网络)两种思路: Skeleton Based Action Recognition(基于骨骼的动作识别)人体的骨骼和关节轨迹对光照变化和场景变化具有鲁棒性,通过高度精确的深度传感器或位姿估计算法很容易获得。因此,这里有一系列基于骨架的动作识别方法。这些方法可以分为基于特征的人工方法和深度学习方法。第一种方法设计了几个人工特征来捕捉关节运动的动态。 三、Spatial Temporal Graph ConvNet(时空图卷积网络)在图像目标识别等任务中,层次化表示和局部性通常是利用卷积神经网络的固有性质来实现的。 3.1 Pipeline Overview (网络架构)
3.2 Skeleton Graph Construction(骨架图的构建)骨架序列通常由每个帧中每个人体关节的2D或3D坐标表示。以前的工作使用卷积来识别骨骼动作,将所有关节的坐标向量连接在一起,形成每帧的单个特征向量。本文利用时空图来形成骨架序列的层次表示,在具有 N N N 个关节和 T T T 个帧的骨架序列上构造了一个无向时空图 G = ( V , E ) G=(V,E) G=(V,E) ,该图既具有体内连接又具有帧间连接。具体表示如下:
3.3 Spatial Graph Convolutional Neural Network(空间图卷积神经网络)1.单个帧情况: 帧
T
T
T 上,有
N
N
N 个关节节点
V
t
V_t
Vt? ,以及骨架边
E
S
=
{
v
t
i
v
t
j
∣
(
i
,
j
)
∈
H
}
E_S=\{v_{ti}v_{tj}|(i,j)∈H\}
ES?={vti?vtj?∣(i,j)∈H},它们都可以被视为2D网络,卷积运算的输出特侦图也是2D网络。步长设置为1,选择合适的padding,输出特征映射可以具有与输入特征映射相同的大小。 然后,通过将上述公式扩展到输入特征图驻留在空间图 V t V_t Vt? 上的情况来定义图上的卷积运算。也就是说:特征图 f i n t : V t → R c f_{in}^t : V_t→R^c fint?:Vt?→Rc 中的特征映射在图形的每个节点上都有一个向量。扩展的下一步是重新定义采样函数 p p p 和权重函数 w w w 。 3.4 Partition Strategies(分区策略)
上述 3 点的图示可依序对应到上图的 (b)、(c)、(d): 3.5 Learnable edge importance weighting(可学边界权重)尽管当人们执行动作时,关节会成组移动,但一个关节可能会出现在身体的多个部位。进行建模时应该具有不同的重要性。在这个意义上,本文在时空图卷积的每一层都增加了一个可学习的掩码M。掩码将基于 E S E_S ES?中每条空间图边的学习重要性权重来缩放节点特征对其相邻节点的贡献。实验发现,加入这种掩码可以进一步提高ST-GCN的识别性能。 3.6 Implementing ST-GCN小白知识普通图像的二维卷积,他可以看成:
X
?
=
X
W
+
b
X^*=XW+b
X?=XW+b。 原文实现在实作上,这些 Graph 的 Edge 会以 Adjacency matrix A 做重现,而每个节点对应自己的重现方法则以 Identity matrix I 实作,而前面Partition Strategies 里的第一种方法则可表述为: 另外 2 种 Partition Strategies 因为有 Subset ,在 Adjacency matrix 的数量上上就比较多,也可以把上个公式的
A
+
I
A + I
A+I 拆解来看: 整个 SGC 则可表述为: 而前面提到过可训练的 Mask M,在这边会加在 A + I A + I A+I 或 A j A_j Aj? 后方:
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/25 20:43:42- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |