| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 【论文下饭】Temporal Graph Network for Deep Learning on Dynamic Graphs -> 正文阅读 |
|
[人工智能]【论文下饭】Temporal Graph Network for Deep Learning on Dynamic Graphs |
文章目录综述 Representation Learning for Dynamic Graphs: A Survey 知识点
1 介绍图表示学习 取得了一系列的成功。 大部分在 图上的深度学习算法 都有一个前提假定——图是静态的。 在动态图上的研究也是今年才兴起的,大多数研究都局限于 离散时间图(discrete-time dynamic graph)。当动态图是连续的(边可以在任何时间出现)、进化的(点可以连续地加入到图钟)时,上面提到的方法都不适合。 直到最近,有很多方法提出 说 支持 连续时间图(continuous-time dynamic graph)。 本文的贡献
2 背景在静态图上的深度学习 动态图
3 Temporal Graph NetworkTGN的介绍。encoder-decoder模型。 3.1 核心模块Memory对于每个节点 i i i,在时刻 t t t,都有一个向量 s i ( t ) s_i(t) si?(t)表示为该节点的记忆单元。它记录了节点 i i i在 [ 0 , t ] [0,t] [0,t]时间内记忆。它代表了节点的“历史”。 有了记忆模块,TGNs就可以记录 每个节点在图中 长期的依赖关系。
Message Function(msg)对于一个 交互事件
e
i
j
(
t
)
e_{ij}(t)
eij?(t),有两个方向的信息。
Message Aggregator(agg)在使用批次(batch)处理时,有一些节点的
m
s
g
msg
msg会被多次使用。 简单地说,就是把 同一批次中所有节点 i i i的 m s g msg msg聚合到一起。
Memory Updater(mem)对于每个事件涉及到的节点,需要更新其记忆单元:
Embedding(emb)向量嵌入模块 可以生成 每个节点 i i i在 t t t时刻的 时序嵌入向量 z i ( t ) z_i(t) zi?(t)。 记忆过期问题
嵌入向量计算的统一形式如下:
L L L 层的图注意力机制,可以利用节点 i i i的 L L L跳的时序邻居信息,计算(节点 i i i)的嵌入向量。 节点 i i i,在 t t t时刻,第 l l l层的输入是 h i ( l ? 1 ) ( t ) h_i^{(l-1)}(t) hi(l?1)?(t),节点 i i i的邻居表示 { h 1 l ? 1 ( t ) , . . . , h N l ? 1 ( t ) } \{h_1^{l-1}(t),...,h_N^{l-1}(t) \} {h1l?1?(t),...,hNl?1?(t)},特征为 e i 1 ( t 1 ) , . . . , e i N ( t N ) e_{i1}(t_1),...,e_{iN}(t_N) ei1?(t1?),...,eiN?(tN?)。
h
i
(
l
)
(
t
)
=
M
L
P
(
l
)
(
h
i
(
l
?
1
)
(
t
)
∥
h
~
i
(
l
)
(
t
)
)
,
h
~
i
(
l
)
(
t
)
=
M
u
l
t
i
H
e
a
d
A
t
t
e
n
t
i
o
n
(
l
)
(
q
(
l
)
(
t
)
,
K
(
l
)
(
t
)
,
V
(
l
)
(
t
)
)
,
q
(
l
)
(
t
)
=
h
i
(
l
?
1
)
(
t
)
∥
?
(
0
)
,
K
(
l
)
(
t
)
=
V
(
l
)
(
t
)
)
=
C
(
l
)
(
t
)
,
C
(
l
)
(
t
)
=
[
h
1
(
l
?
1
)
(
t
)
∥
e
i
1
(
t
1
)
∥
?
(
t
?
t
1
)
,
.
.
.
,
h
N
(
l
?
1
)
(
t
)
∥
e
i
N
(
t
N
)
∥
?
(
t
?
t
N
)
]
\begin{aligned} &\bold{h}_i^{(l)}(t) = \mathrm{MLP}^{(l)}(\bold{h}_i^{(l-1)}(t) \parallel \tilde{h}_i^{(l)}(t)), \\ &\tilde{\bold{h}}_i^{(l)}(t) = \mathrm{MultiHeadAttention}^{(l)}(\bold{q}^{(l)}(t),\bold{K}^{(l)}(t),\bold{V}^{(l)}(t)),\\ &\bold{q}^{(l)}(t) = \bold{h}_i^{(l-1)}(t) \parallel \phi(0),\\ &\bold{K}^{(l)}(t) = \bold{V}^{(l)}(t)) = \bold{C}^{(l)}(t), \\ &\bold{C}^{(l)}(t) = [\bold{h}_1^{(l-1)}(t) \parallel \bold{e}_{i1}(t_1) \parallel \phi(t-t_1),...,\bold{h}_N^{(l-1)}(t) \parallel \bold{e}_{iN}(t_N) \parallel \phi(t-t_N)] \end{aligned}
?hi(l)?(t)=MLP(l)(hi(l?1)?(t)∥h~i(l)?(t)),h~i(l)?(t)=MultiHeadAttention(l)(q(l)(t),K(l)(t),V(l)(t)),q(l)(t)=hi(l?1)?(t)∥?(0),K(l)(t)=V(l)(t))=C(l)(t),C(l)(t)=[h1(l?1)?(t)∥ei1?(t1?)∥?(t?t1?),...,hN(l?1)?(t)∥eiN?(tN?)∥?(t?tN?)]? 简单地说,就是一个多头注意力机制,重点在 C \bold{C} C中,把时序特征一并输入。 特别地,与TGAT中提到的不同的是,在第 0 0 0层时,本文考虑了节点本身的特征 v ( t ) \bold{v}(t) v(t)(node-wise temporal features),即 h j ( 0 ) ( t ) = s j ( t ) + v j ( t ) h_j^{(0)}(t) = s_j(t)+\bold{v}_j(t) hj(0)?(t)=sj?(t)+vj?(t)。这使得模型可以同时利用 现有的记忆 s j ( t ) s_j(t) sj?(t)和时序节点特征 v j ( t ) \bold{v}_j(t) vj?(t)。
同样地, ? \phi ? 是一个 通用的时序编码器(generic time encoding),最后得到的嵌入向量为 z i ( t ) = e m b ( i , t ) = h i ( L ) ( t ) \bold{z}_i(t) = \mathrm{emb}(i,t) = \bold{h}_i^{(L)}(t) zi?(t)=emb(i,t)=hi(L)?(t)。 图向量嵌入模块 通过聚合邻居的记忆信息,缓和了 (记忆)过期问题,使得TGN可以计算最新的嵌入向量信息。
3.2 训练TGN可以用于许多任务上,比如说 边集预测(自监督)或者 节点分类(半监督)。 我们使用 连接预测作为例子:提供一系列时间排序的交互,我们的目标是从过去的观察中,预测未来可能出现的交互。
之前提到的训练策略在 记忆相关模块中 存在问题——不能直接影响loss,也就是说接收不到梯度。 为了解决这个问题,记忆单元(memory)必须在预测交互之前 更新。但是,这就造成了信息泄露(information leakage)。
需要注意的是,我们的
4 相关工作早期的工作 都集中于DTDGs上。
另一条编码DTDGs的主线工作:先在初始的快照上使用 随机游走,然后对于子序列快照修改游走行为。 时空图(spatio-temporal graphs)是动态图的特例。因为 时空图的 拓扑逻辑是固定的。 CTDGs。
许多的架构用的都是基于RNN的 最新的CTDGs学习模型,都可以看作本文框架TGN的一个特例。 5 实验数据集 任务:edge prediction(预测两个节点未来出现连接的概率)。同时研究了
本文使用的解码器是一个简单的MLP。 Baselines 5.1 性能表现(实验结果)总结:最好的模型 5.2 模块选择Memory比较的模块:
现象:
结论:
Embedding Moudle比较的模块:
现象:
结论:
Message Aggregator比较的模块:
现象:
Number of layers比较的模块:
比较使用到的GNN层数,因为在TGAT中,两层比一层 好了不止10%。 现象:
结论:
6 结论
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/6 17:40:31- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |