| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 论文笔记--Attention Based Spatial-Temporal Graph Convolutional Networks for Traffic Flow Forecasting -> 正文阅读 |
|
[人工智能]论文笔记--Attention Based Spatial-Temporal Graph Convolutional Networks for Traffic Flow Forecasting |
Attention Based Spatial-Temporal Graph Convolutional Networks for Traffic Flow Forecasting (AAAI 19) Summary 作者提出ASTGCN的主要由三个独立组件组成,分别对交通流的三种节奏特性(近期依赖、日周期依赖和周周期依赖)进行建模。每个组件包含两个主要部分:1)有效捕获交通数据中动态时空相关性的时空注意机制;2)时空卷积,即同时使用图卷积来捕获空间模式和通用标准卷积来捕获时间特征。三个组件的结果相融合得到最终预测结果。 Problem Definition 交通预测问题最大挑战还是如何有效提取数据的时空相关性。如下图 线条颜色越深,影响越大。从图(a)表示的是空间依赖的关系,不同的地点对A的影响是不同的,即使是同一个地点随着时间的推移对A的影响也是不同的。在时间维度下图(b),不同位置的历史观测结果对A未来不同时段的交通状态有不同的影响。综上所述,公路网交通数据相关性在空间维度和时间维度上均表现出较强的动态性。 问题定义 将交通网络定义为一个无向图表示为 G = ( V , E , A ) G=(V,E,A) G=(V,E,A),V表示节点列表,E是边集, A ∈ R N × N A\in \mathbb{R}^{N\times N} A∈RN×N是邻接矩阵。定义 X = ( X 1 , X 2 , … , X τ ) T ∈ R N × F × τ \mathcal{X}=\left(\mathbf{X}_{1}, \mathbf{X}_{2}, \ldots, \mathbf{X}_{\tau}\right)^{T} \in \mathbb{R}^{N \times F \times \tau} X=(X1?,X2?,…,Xτ?)T∈RN×F×τ表示τ时间内所有节点的所有特征值。利用交通网络中所有节点在过去 τ \tau τ时间内的各种历史测度,预测未来交通流序列 ( y 1 , y 2 , . . . , y N ) t ∈ R N × T p (y^1,y^2,...,y^N)^t \in \mathbb{R}^{N\times T_p} (y1,y2,...,yN)t∈RN×Tp?。 Method ASTGCN算法框架 输入 ① X h = ( X t 0 ? T h + 1 , X t 0 ? T h + 2 , … , X t 0 ) ∈ R N × F × T h \mathcal{X}_{h}=\left(\mathbf{X}_{t_{0}-T_{h}+1}, \mathbf{X}_{t_{0}-T_{h}+2}, \ldots, \mathbf{X}_{t_{0}}\right) \in \mathbb{R}^{N \times F \times T_{h}} Xh?=(Xt0??Th?+1?,Xt0??Th?+2?,…,Xt0??)∈RN×F×Th?表示的是最近时间段交通信息,长度为Th。从直观上看,交通拥挤的形成和扩散是渐进的。因此,过去的交通流必然会对未来的交通流产生影响。 ② ③ 输入数据可视化表示如下 时空注意力模块 ①空间注意力 首先通过
X
h
(
r
?
1
)
=
(
X
1
,
X
2
,
…
X
T
r
?
1
)
∈
R
N
×
C
r
?
1
×
T
r
?
1
\boldsymbol{X}_{h}^{(r-1)}=\left(\mathbf{X}_{1}, \mathbf{X}_{2}, \ldots \mathbf{X}_{T_{r-1}}\right) \in \mathbb{R}^{N \times C_{r-1} \times T_{r-1}}
Xh(r?1)?=(X1?,X2?,…XTr?1??)∈RN×Cr?1?×Tr?1?计算出注意力矩阵S,
S
i
,
j
S_{i,j}
Si,j?表示节点i与节点j的相关强度。然后通过softmax使节点注意权值之和为1。 然后注意力矩阵S’在图卷积部分将与邻接矩阵A共同调节节点间的影响权重。 ②时间注意力 计算时间维度的注意力系数
E
=
V
e
?
σ
(
(
(
X
h
(
r
?
1
)
)
T
U
1
)
U
2
(
U
3
X
h
(
r
?
1
)
)
+
b
e
)
E
i
,
j
′
=
exp
?
(
E
i
,
j
)
∑
j
=
1
T
r
?
1
exp
?
(
E
i
,
j
)
\begin{gathered} \mathbf{E}=\mathbf{V}_{e} \cdot \sigma\left(\left(\left(\mathcal{X}_{h}^{(r-1)}\right)^{T} \mathbf{U}_{1}\right) \mathbf{U}_{2}\left(\mathbf{U}_{3} \mathcal{X}_{h}^{(r-1)}\right)+\mathbf{b}_{e}\right) \\ \mathbf{E}_{i, j}^{\prime}=\frac{\exp \left(\mathbf{E}_{i, j}\right)}{\sum_{j=1}^{T_{r-1}} \exp \left(\mathbf{E}_{i, j}\right)} \end{gathered}
E=Ve??σ(((Xh(r?1)?)TU1?)U2?(U3?Xh(r?1)?)+be?)Ei,j′?=∑j=1Tr?1??exp(Ei,j?)exp(Ei,j?)?? 对于时间注意力块,作者直接将归一化的时间注意矩阵应用于输入,计算公式如下
X
^
h
(
r
?
1
)
=
(
X
^
1
,
X
^
2
,
…
,
X
^
T
r
?
1
)
=
(
X
1
,
X
2
,
…
,
X
T
r
?
1
)
E
′
\hat{\boldsymbol{X}}_{h}^{(r-1)}=\left(\hat{\mathbf{X}}_{1}, \hat{\mathbf{X}}_{2}, \ldots, \hat{\mathbf{X}}_{T_{r-1}}\right)=\left(\mathbf{X}_{1}, \mathbf{X}_{2}, \ldots, \mathbf{X}_{T_{r-1}}\right) \mathbf{E}^{\prime}
X^h(r?1)?=(X^1?,X^2?,…,X^Tr?1??)=(X1?,X2?,…,XTr?1??)E′ ①空间维卷积 采用的是谱域方法(具体是Cheby-conv方法改进得到)。Cheby-conv计算公式如下 为了动态调整节点之间的相关性,对每一项的 T k ( L ~ ) T_k(\tilde{L}) Tk?(L~)与空间注意力矩阵 S ′ ∈ R N × N S'\in \mathbb{R}^{N\times N} S′∈RN×N进行哈达玛乘积。 具体公式如下 ②时间维卷积 *表示标准卷积,此处应该是1D-conv,将时间点的前后数据也一起融合了一下,得到了整个模块的最终输出。 最后对三种输入得到的三种输出进行融合,公式如下 Experiments 数据使用两个加州高速数据PeMSD4和PeMSD8。 参数设置 T h = 24 , T d = 12 , T w = 24 T_h=24,T_d=12,T_w=24 Th?=24,Td?=12,Tw?=24切比雪夫多项式K={1,2,3},预测时间步长 T p = 12 T_p=12 Tp?=12 实验结果如下 MSTGCN是未使用注意力机制的模型。 下图是各种方法在预测区间增大下的影响。 作者挑选了包含10个点的子图,并显示训练集中节点之间的平均空间注意矩阵。如下,最后一行,我们可以知道第9个点的车流与第3个点和第8个点上的车流是密切相关的。他们三个点在空间上也是相互接近的,很合理。 创新点 不仅仅使用相近时间的历史数据来预测,还考虑了同一天的同一时刻,同一周的时刻的影响来辅助预测。还有就是使用注意力直接学习时间空间相关性。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 10:17:04- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |