STGCN
摘要
传统方法无法实现精确的中长期预测,忽视时空相关性。我们提出了一种新颖的时空图卷积网络,采用了全卷积结构。
方法
图卷积:GCN
时间卷积:卷积核在时间维度上滑动,对于长度为
M
M
M的序列和宽度为
K
t
K_t
Kt?的卷积核,输出长度为
M
?
K
t
+
1
M-K_t+1
M?Kt?+1,最后使用了门控机制GLU
T
?
τ
Y
=
P
⊙
σ
(
Q
)
T *_{\tau}Y=P\odot\sigma(Q)
T?τ?Y=P⊙σ(Q) P和Q是使用不同参数的时间卷积的输出。
模型: 中间的是时空卷积块,两个时间卷积中间夹了图卷积,应用了瓶颈策略:图卷积的通道数很少,减少计算量
每一个时空卷积块后使用了layer normalization,对结点和特征做归一化。
第
l
l
l个时空卷积块,对于输入
v
l
∈
R
M
×
n
×
C
l
v^l\in R^{M\times n\times C^l}
vl∈RM×n×Cl,输出
v
l
+
1
∈
R
(
M
?
2
(
K
t
?
1
)
)
×
n
×
C
l
+
1
v^{l+1}\in R^{(M-2(K_t-1))\times n\times C^{l+1}}
vl+1∈R(M?2(Kt??1))×n×Cl+1
v
l
+
1
=
Γ
1
l
?
τ
R
e
L
U
(
Θ
l
?
G
(
Γ
0
l
?
τ
v
l
)
)
v^{l+1}=\Gamma^l_1*_\tau ReLU(\Theta^l*_G(\Gamma^l_0*_\tau v^l))
vl+1=Γ1l??τ?ReLU(Θl?G?(Γ0l??τ?vl))
Γ
0
l
\Gamma^l_0
Γ0l?和
Γ
1
l
\Gamma^l_1
Γ1l?分别是上面和下面的时间卷积核,
Θ
l
\Theta^l
Θl是图卷积核,在最后一个时空卷积块的后面附加了一个时间卷积层,将时间维度变为1,最后使用全连接层,实现单步预测
DCRNN
摘要
交通预测存在3个挑战:(1)路网上复杂的空间相关性,(2)非线性时间相关性,以及持续变化的路况,(3)实现长期预测的固有困难。我们将交通流建模成有向图上的扩散过程,提出了DCRNN。
方法
空间:扩散卷积,看作在图上的随机游走,经过多步后这个马尔可夫过程收敛到平稳分布,这里取K次迭代
X
:
,
p
?
G
f
θ
=
∑
k
=
0
K
?
1
(
θ
k
,
1
(
D
O
?
1
W
)
k
+
θ
k
,
2
(
D
I
?
1
W
T
)
k
)
X
:
,
p
X_{:,p}\star_G f_{\theta}=\sum_{k=0}^{K-1}(\theta_{k,1}(D_O^{-1}W)^k+\theta_{k,2}(D_I^{-1}W^T)^k)X_{:,p}
X:,p??G?fθ?=k=0∑K?1?(θk,1?(DO?1?W)k+θk,2?(DI?1?WT)k)X:,p?
D
O
?
1
W
D_O^{-1}W
DO?1?W和
D
I
?
1
W
T
D_I^{-1}W^T
DI?1?WT分别表示前向和后向转移矩阵。扩展到多输出就是
H
:
,
q
=
a
(
∑
p
=
1
P
X
:
,
p
?
G
f
Θ
q
,
p
,
:
,
:
)
H_{:,q}=a(\sum_{p=1}^PX_{:,p}\star_Gf_{\Theta_{q,p,:,:}})
H:,q?=a(p=1∑P?X:,p??G?fΘq,p,:,:??)
Θ
∈
R
Q
×
P
×
K
×
2
\Theta\in R^{Q\times P\times K\times2}
Θ∈RQ×P×K×2,从P维映射到Q维。
时间:用扩散卷积替换GRU中的矩阵乘法 采用Endoder-Decoder结构进行多步预测,Decoder训练时输入真实值,预测时输入预测值,为了防止这种差异影响模型的性能,采用了Scheduled Sampling技术。
Graph WaveNet
摘要
现有的时空图建模方法都假设图结构是固定的,由于连接不完整,可能并没有反映真正的依赖关系,这些方法中使用的RNN和CNN不能捕获长期依赖。本文使用自适应邻接矩阵提取隐藏的空间依赖,使用堆叠的1维空洞卷积:感受野随层数指数增长,能够处理十分长的序列。
方法
图卷积:
Z
=
∑
k
=
0
K
P
f
k
X
W
k
1
+
P
b
k
X
W
k
2
+
A
~
a
p
t
k
X
W
K
3
Z=\sum_{k=0}^{K}P_f^kXW_{k1}+P_b^kXW_{k2}+\tilde{A}^k_{apt}XW_{K3}
Z=k=0∑K?Pfk?XWk1?+Pbk?XWk2?+A~aptk?XWK3?
P
f
P_f
Pf?为归一化后的邻接矩阵 ,
P
b
P_b
Pb?是邻接矩阵的转置的归一化,分别代表前向转移矩阵和后向转移矩阵,
A
~
a
p
t
\tilde{A}_{apt}
A~apt?是自适应邻接矩阵
A
~
a
p
t
=
S
o
f
t
m
a
x
(
R
e
L
U
(
E
1
E
2
T
)
)
\tilde{A}_{apt}=Softmax(ReLU(E_1E_2^T))
A~apt?=Softmax(ReLU(E1?E2T?))
E
1
,
E
2
∈
R
N
×
c
E_1,E_2\in R^{N\times c}
E1?,E2?∈RN×c为结点嵌入矩阵,
E
1
E_1
E1?是源结点嵌入,
E
2
E_2
E2?是目标结点嵌入。
时间卷积:带门控机制的一维因果卷积(GLU),采用了空洞卷积。
h
=
g
(
Θ
1
?
X
+
b
)
⊙
σ
(
Θ
2
?
X
+
b
)
h=g(\Theta_1\star X+b)\odot \sigma(\Theta_2\star X+b)
h=g(Θ1??X+b)⊙σ(Θ2??X+b) 模型:实验时共8层,空洞率为[1,2,1,2,1,2,1,2]: 人工设计感受野大小,使最后一层时空卷积层输出的时间维度为1,经全连接层映射为输出维度
ASTGCN
待更新
|