| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> ICLR 2017 | GCN:基于图卷积网络的半监督分类 -> 正文阅读 |
|
[人工智能]ICLR 2017 | GCN:基于图卷积网络的半监督分类 |
前言
阅读前建议读一下前面几篇关于GNN的入门文章:
在TNNLS | GNN综述:A Comprehensive Survey on Graph Neural Networks一文中对GCN进行了大概的讲解,讲解如下: ConvGNN分为两种:基于频域的和基于空间域的。其中基于频域的方法通过从图信号处理的角度引入过滤器(卷积核的集合)来定义图卷积,其中图卷积运算被解释为从图信号中去除噪声。 基于空间域的ConvGNN继承了RecGNN的思想,通过消息传递来定义图卷积运算。 A. Spectral-Based ConvGNN基于频域的ConvGNN:假设图是无向的。无向图的归一化图拉普拉斯矩阵定义为: 对图进行处理时, x ∈ R n x \in R^n x∈Rn表示为所有节点的特征向量, x i x_i xi?为第 i i i个节点的特征向量。 x x x的图傅里叶变换为: ? ( x ) = U T x \Im(x)=U^Tx ?(x)=UTx,逆图傅里叶变换为: ? ? 1 ( x ^ ) = U x ^ \Im^{-1}(\hat{x})=U\hat{x} ??1(x^)=Ux^,其中 x ^ \hat{x} x^表示傅里叶变换的结果信号。 由以上定义可知,图傅里叶变换将输入图信号投影到标准化空间,其中空间基由标准化图拉普拉斯算子的特征向量形成。原始输入信号可以被表示为: x = ∑ i x ^ i u i x= \sum_{i}\hat{x}_iu_i x=∑i?x^i?ui?(逆图傅里叶变换)。 有了以上定义后,输入信号与过滤器
g
∈
R
b
g \in R^b
g∈Rb间的卷积运算被定义为: 比如:Spectral CNN假设过滤器
g
θ
=
Θ
i
,
j
(
k
)
g_{\theta}=\Theta_{i, j}^{(k)}
gθ?=Θi,j(k)?是一组可学习的参数,Spectral CNN的图卷积层定义为: B. Spatial-Based ConvGNN基于空间域的ConvGNN:基于节点的空间关系来定义图卷积。 Image可以被视为Graph的特殊形式,每个像素代表一个节点,每个像素直接连接到其附近的像素: 图的神经网络(NN4G)是基于空间域的ConvGNN的第一个工作,它通过直接汇总节点的邻域信息来执行图卷积,NN4G导出的下一层的节点状态公式为: PGC-DGCNN基于最短路径增加了远处邻居的贡献。PGC-DGCNN定义了最短路径邻接矩阵
S
(
j
)
S^{(j)}
S(j):如果节点
v
v
v到结节点
u
u
u的最短路径长度为
j
j
j,则
S
v
,
u
(
j
)
=
1
S_{v,u}^{(j)}=1
Sv,u(j)?=1,否则为0。PGC-DGCNN中的图卷积运算定义如下: 本篇文章提出的GCN是基于空间域的ConvGNN。 1. 引言考虑在图中对节点进行分类的问题,图中只有少数节点被标记,然后我们的任务是预测未标记节点的标签,这种问题就是图的半监督分类。 解决上述问题比较经典的方法: 上式中加上正则化项后,如果两个节点邻接( A i j ≠ 0 A_{ij} \neq 0 Aij??=0),那么我们会认为它们可能共享同一标签。这种假设会限制模型的表达能力,因为图中的边不一定需要编码节点相似性,也可能是其它信息。 2. 图的快速近似卷积传统的图卷积: 本文提出的图卷积传播规则: 可以发现,本文在传统图卷积的基础上做了两点创新:
3. 半监督节点分类有了上述图卷积的传播规则后,半监督节点分类就变得很简单了。比如说我们要分为两类,那么只需要在GCN后加上一个输出为2的全连接层,然后再经过一个Softmax即可。得到输出后再算出交叉熵损失,然后反向传播更新每一层GCN的参数 W W W。 比如考虑只有一个隐藏层的简单模型: 简单来说,我们有: 然后我们有交叉熵损失: 然后损失函数对神经网络参数 W ( 0 ) W^{(0)} W(0)和 W ( 1 ) W^{(1)} W(1)求导,梯度下降更新参数,更新后进行新一轮的传播。 等到训练了一定轮数后,我们就可以对未标记的节点标签的类别进行预测了。 4. 实验数据集 实验结果 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 19:32:10- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |