IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 第六周.02.VGAE带读+代码实操 -> 正文阅读

[人工智能]第六周.02.VGAE带读+代码实操


本文内容整理自深度之眼《GNN核心能力培养计划》
公式输入请参考: 在线Latex公式
本周涉及到auto encoder,这个思想在CV和语音处理上都有应用,有想简单了解这块的,看我的笔记:
Deep Auto-encoder

More About Auto-Encoder
VAE看这里:Unsupervised Learning.05: Deep Generative Model (Part I)
本节主要讲VGAE:Variational Graph Auto-Encoders
Variational Graph Auto-Encoders相对于普通的Graph Auto-Encoders而言,相同之处在于大家都是数据经过Encoder,得到表征,然后经过Decoder,还原得到数据’(这里还原的是邻接矩阵),目标是使得数据和数据’越接近越好,是一种无监督的学习方式。Variational Graph Auto-Encoders则引入了更多的贝叶斯的东西来优化损失函数。
总共涉及三篇文章:
Variational Graph Auto-Encoders
Auto-Encoding Variational Bayes
Tutorial on Variational Autoencoders(比较详细)
当然还要参考之前GNN基础篇的深度之眼Paper带读笔记GNN.03.SDNE
下面来看Variational Graph Auto-Encoders这篇文章

Variational Graph Auto-Encoders

开篇文章就提出VGAE是a framework for unsupervised learning on graph-structured data based on the variational auto-encoder
模型还引入了隐变量来进行计算,如果理解不了就直接把这个计算得到的隐变量看做是AE结构里面中间的embedding表示。
模型使用均值和方差的采样结果(这个结果就是上面提到的隐变量)来代替常规AE模型中的中间表征。
this model using a graph convolutional network (GCN) [4] encoder and a simple inner product decoder.
模型的编码器用的GCN,解码器用的是点乘。
模型在非监督学习的图结构数据以及边预测(这个任务是)任务取得较好效果。

定义:无向无权图 G = ( V , E ) \mathcal{G}=(\mathcal{V,E}) G=(V,E),节点数量 N = ∣ V ∣ N=|\mathcal{V}| N=V,图的邻接矩阵是 A A A,且里面包含节点本身的信息(相当于 A ′ = A + I A'=A+I A=A+I),图的度矩阵是 D D D,引入的隐变量是 z i z_i zi?,其矩阵形式是: Z Z Z,维度是 N × F N\times F N×F,节点特征是 X X X,维度是 N × D N\times D N×D

Inference model:
q ( Z ∣ X , A ) = ∏ i = 1 N q ( z i ∣ X , A ) , w i t h ? q ( z i ∣ X , A ) = N ( z i ∣ μ i , d i a g ( σ i 2 ) ) q(Z|X,A)=\prod_{i=1}^Nq(z_i|X,A),with\space q(z_i|X,A)=\mathcal{N}(z_i|\mu_i,diag(\sigma_i^2)) q(ZX,A)=i=1N?q(zi?X,A),with?q(zi?X,A)=N(zi?μi?,diag(σi2?))
上式中,是要最大所有节点的概率的连乘,这个概率 q ( z i ∣ X , A ) q(z_i|X,A) q(zi?X,A)的条件是两个已知条件,节点的特征和邻接矩阵,那么每个隐变量 z i z_i zi?相当于从一个高斯分布( μ i , σ i 2 \mu_i,\sigma_i^2 μi?,σi2?)进行采样得到的结果。高斯分布的两个参数都是从不同的encoder GCN得来:
μ = G C N μ ( X , A ) , log ? σ = G C N σ ( X , A ) \mu=GCN_\mu(X,A),\log\sigma=GCN_\sigma(X,A) μ=GCNμ?(X,A),logσ=GCNσ?(X,A)
两个GCN都是两层的,结构一样,第一层参数一样,但是第二层参数不一样,因此两个GCN的下标不一样。
Generative model:Decoder部分就是用上面得到的两个点的隐变量做内积:
p ( A ∣ Z ) = ∏ i = 1 N ∏ j = 1 N p ( A i j ∣ z i , z j ) ; w i t h p ( A i j = 1 ∣ z i , z j ) = σ ( z i ? z j ) p (A|Z) =\prod_{i=1}^N\prod_{j=1}^Np (A_{ij} | z_i,z_j); with p (A_{ij}= 1 | z_i,z_j) = \sigma(z_i^\top zj) p(AZ)=i=1N?j=1N?p(Aij?zi?,zj?);withp(Aij?=1zi?,zj?)=σ(zi??zj)
这个公式的意思就是根据邻接矩阵找到有边相连的两个节点( A i j = 1 A_{ij}= 1 Aij?=1),然后把两个点的隐变量做内积(实际上就是相似度计算),然后经过sigmoid函数变成概率。
损失函数:
L = E q ( Z ∣ X , A ) [ log ? p ( A ∣ Z ) ] ? K L [ q ( Z ∣ X , A ) ∣ ∣ p ( Z ) ] L = E_{q(Z|X,A)}[\log p (A|Z)]-KL[q(Z|X,A)|| p(Z)] L=Eq(ZX,A)?[logp(AZ)]?KL[q(ZX,A)p(Z)]
这里注意两点:
1、由于A的稀疏性,使用了权重项来平衡值为1的数量比较小的位置,这个trick和SDNE是一样的,具体可以看之前的SDNE笔记中,关于一阶二阶相似度的描述;
2、中间生成隐变量的过程中用到了采样这个操作,这个操作是不可导的,因此不能直接做反向传播计算,在李宏毅的课程里面提到过有几种解决方案(太久了忘记在哪篇里面了),这里用了一种reparameterization trick来解决这个问题。
这个trick的公式在下面的文章,这里先搬上来:
z = μ ( X ) + Σ 1 / 2 ( X ) ? , ? ~ N ( 0 , I ) (1) z = \mu(X) + \Sigma^{1/2}(X) \epsilon,\epsilon\sim\mathcal{N}(0,I)\tag1 z=μ(X)+Σ1/2(X)?,?N(0,I)(1)

GAE

graph auto-encoder(GAE) model就是把中间采样隐变量的步骤去掉,直接用GCN得到Z,再用点乘还原邻接矩阵。
A ^ = σ ( Z Z ? ) , w i t h ? Z = G C N ( X , A ) \hat A=\sigma(ZZ^\top) , with\space Z=GCN(X,A) A^=σ(ZZ?),with?Z=GCN(X,A)

实验

用边预测来测试模型效果(VGAE和GAE),训练的时候,预先将数据集中的一些边拿掉,点的特征不变,然后再把边拿回来,做成验证和测试集。除了这两个模型,文章还加了谱聚类和DeepWalk两个基线,这两个模型都可以得到节点的表征,然后用表征可以丢到上面的 A ^ = σ ( Z Z ? ) \hat A=\sigma(ZZ^\top) A^=σ(ZZ?),从而比较模型还原的效果。
在这里插入图片描述
表中,带星号的表示用的独热编码作为节点特征初始化。

Tutorial on Variational Autoencoders

原文的图4,编码器用的GCN,解码器用的是点乘
在这里插入图片描述
上图中左边是正常流程,总结红色代表采样操作,这个操作由于不可导,反向传播无法使用,因此将其改成右边的的方式,先从标准的高斯分布进行采样,然后在做乘法,然后再加。

VGAE实操

原PY代码看这里

#导入相应的包
from dgl.nn.pytorch import GraphConv
import torch
import torch.nn as nn
import torch.nn.functional as F
#定义VGAEModel
class VGAEModel(nn.Module):
    def __init__(self, in_dim, hidden1_dim, hidden2_dim):#初始化VGAE
        super(VGAEModel, self).__init__()
        self.in_dim = in_dim#输入特征维度
        self.hidden1_dim = hidden1_dim#两个隐藏层维度
        self.hidden2_dim = hidden2_dim

        #三层GraphConv,原文中生成均值和方差的W0是共享的,W1是不同的,因此一共要三层
        #https://docs.dgl.ai/en/0.6.x/_modules/dgl/nn/pytorch/conv/graphconv.html
        #GraphConv用于实现GCN的卷积
        layers = [GraphConv(self.in_dim, self.hidden1_dim, activation=F.relu, allow_zero_in_degree=True),#第一层,共享参数
                  GraphConv(self.hidden1_dim, self.hidden2_dim, activation=lambda x: x, allow_zero_in_degree=True),#第二层求均值
                  GraphConv(self.hidden1_dim, self.hidden2_dim, activation=lambda x: x, allow_zero_in_degree=True)]#第二层求方差
        self.layers = nn.ModuleList(layers)

    def encoder(self, g, features):
        h = self.layers[0](g, features)#第一层得到输出h
        self.mean = self.layers[1](g, h)#第二层求均值
        self.log_std = self.layers[2](g, h)#第二层求方差
        gaussian_noise = torch.randn(features.size(0), self.hidden2_dim).to(device)#标准高斯分布采样,大小是features_size*hidden2_dim
        sampled_z = self.mean + gaussian_noise * torch.exp(self.log_std).to(device)#这里其实是reparameterization trick,具体看公式1和代码如何对应
        return sampled_z

    def decoder(self, z):
        adj_rec = torch.sigmoid(torch.matmul(z, z.t()))#解码器点乘还原邻接矩阵A'
        return adj_rec

    def forward(self, g, features):#前向传播
        z = self.encoder(g, features)#编码器得到隐变量
        adj_rec = self.decoder(z)#解码器还原邻接矩阵
        return adj_rec
  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-07-17 11:54:48  更:2021-07-17 11:55:46 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年4日历 -2024/4/25 8:21:34-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码