| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 【论文阅读】Simplifying Graph Convolutional Networks -> 正文阅读 |
|
[人工智能]【论文阅读】Simplifying Graph Convolutional Networks |
目录Abstract在本文中,通过移除非线性和折叠权重矩阵来降低原来的GCN中额外的复杂性。本文从理论上分析了所得到的线性模型,并表明它对应于一个固定的低通滤波器和一个线性分类器。 IntroductionGCNs将学习的一阶谱滤波器堆叠在一起,然后使用非线性激活函数来学习图形表示。 我们提出了SGC,通过反复消除GCN层之间的非线性,并将生成的函数折叠为单个线性变换,来降低GCN的过度复杂性。最终的线性模型在各种任务上表现出与GCN相当甚至更高的性能,同时计算效率更高,拟合的参数更少。 Simple Graph Convolution定义
G
=
(
V
,
A
)
G=(V,A)
G=(V,A),
V
V
V为顶点集,
A
A
A为邻接矩阵,
D
D
D为顶点度矩阵。每个顶点
v
i
v_i
vi?有一个对应的
d
d
d维的特征向量
x
i
x_i
xi?,所有特征向量为
X
X
X。每个顶点都属于
C
C
C类中的一个,
Y
Y
Y表示类别标签集合。 GCNGCN为每个节点的特征 x i x_i xi?学习一种新的特征表示,随后将其用作线性分类器的输入。在每个图卷积层中,节点表示在三个方向更新:特征传播、线性变换和逐点非线性激活 。 Feature propagation在每个层的开始处,每个节点
v
i
v_i
vi?的特征
h
i
h_i
hi?用其局部邻域中的特征向量进行平均: Feature transformation and nonlinear transition局部平滑后,GCN层与标准MLP相同。每一层都与一个学习的权重矩阵相关联,在输出特征表示之前,逐点应用非线性激活函数,如ReLU 。 Classifier对于节点分类,与标准MLP类似,GCN的最后一层使用softmax分类器预测标签 Simple Graph Convolution在GCN中,每一层中,隐藏的表示为一跳邻居之间的平均。这意味着在k层之后,一个顶点从其k层邻居中获得特征信息。 Spectral Analysis我们现在从图卷积的角度研究SGC。我们证明了SGC对应于图谱域上的固定滤波器。此外,我们还表明,向原始图中添加自循环,可以有效地缩小基础图谱。在这个缩放域上,SGC充当低通滤波器,在图形上生成平滑的特征。因此,附近的节点倾向于共享相似的表示,从而实现预测。 Preliminaries on Graph Convolutions图傅立叶分析依赖于图拉普拉斯算子的谱分解。图拉普拉斯为
Δ
=
D
?
A
\Delta=D-A
Δ=D?A(正则化形式为
Δ
s
y
m
=
D
?
1
/
2
Δ
D
?
1
/
2
\Delta_{sym}=D^{-1/2}\Delta D^{-1/2}
Δsym?=D?1/2ΔD?1/2),其特征分解为
Δ
=
U
Λ
U
T
\Delta=U\Lambda U^T
Δ=UΛUT。拉普拉斯算子的特征分解允许我们等价地在图域上定义傅里叶变换,其中特征向量表示图的傅里叶模式,特征值表示图的频率。图的卷积操作为: SGC and Low-Pass Filtering初始一阶切比雪夫滤波器对应于GCN的传播矩阵:
S
1
?
o
r
d
e
r
=
I
+
D
?
1
/
2
A
D
?
1
/
2
=
2
I
?
Δ
s
y
m
S_{1-order}=I+D^{-1/2}AD^{-1/2}=2I-\Delta_{sym}
S1?order?=I+D?1/2AD?1/2=2I?Δsym?,因此,
S
1
?
o
r
d
e
r
K
S_{1-order}^K
S1?orderK?特征传播意味着滤波器系数
g
^
i
=
g
^
(
λ
i
)
=
(
2
?
λ
i
)
K
\hat g_i=\hat g(\lambda_i)=(2-\lambda_i)^K
g^?i?=g^?(λi?)=(2?λi?)K。 根据下图可以观察到,
S
1
?
o
r
d
e
r
S_{1-order}
S1?order?的高次幂会导致滤波器系数爆炸(图中蓝线),并在
λ
i
<
1
\lambda_i<1
λi?<1时过度放大信号。 一个小插曲: 回到原文 还是上图,可以看到原始的、归一化的、增广归一化的
图的有效信息往往蕴含在低频段,没有必要为每一个频段训练一个参数(不用学习卷积核参数) |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 6:30:02- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |