IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> Link prediction in heterogeneous information networks: An improved deep graph convolution approach -> 正文阅读

[人工智能]Link prediction in heterogeneous information networks: An improved deep graph convolution approach

Link prediction in heterogeneous information networks: An improved deep graph convolution approach-异构信息网络中的链路预测:一种改进的深度图卷积方法

创新点

  1. 开发一种可应用于不同类型信息系统的链接预测方法。换句话说,开发一种可以处理多种HINs类型的方法,而不考虑使用环境。
  2. 通过整合对象的结构信息和不同类型的固有特征,包括文本特征、类别特征和数字特征,减少链路预测方法的信息损失,提高链路预测的性能。

提出的方法

①提出了一种基于社区发现的方法,选择性地识别与目标顶点结构相关的邻域顶点,过滤掉局部连通但结构无关的顶点。通过获取顶点的多关系局部子图,可以利用深度卷积神经网络(CNN)进行进一步的嵌入学习。
②通过对一个新的可优化核层和几个全连接层的顶点进行配对,可以得到目标链路的预测

具体过程

在这里插入图片描述

stage1:局部领域发现

原始的基于模块化的社区发现方法首先为每个顶点分配一个唯一的子社区,然后通过贪婪策略检查子社区邻域。如果社区的质量度量得到改善,则局部连通的顶点被合并成一个新的子社区。重复该过程,直到质量度量不能通过任何新的合并操作来改进。最广泛使用的质量度量是模块化
在这里插入图片描述
li,j代表了在顶点vi和vj的链路关系,w(.)代表了给一个链路的权重,ki代表了节点vi的直连领域的权重之和,ci表示vi所属的当前子社区的id,δ(ci,cj) 代表了狄拉克三角洲函数(主要是密度分布函数)等价于 1 if ci =cj and 0 otherwise, m代表了值为li,j关系权重的求和,但作者考虑到大规模的合并操作可能会产生较大的子社区,会削弱子社区的信息特性,为了M修改为:
在这里插入图片描述
式中C代表了子社区的集合,小写的c代表了子社区的size,
①M‘的第一阶段段鼓励一组真正的结构上相关的顶点形成一个结合的局部子社区,并过滤掉不相关的邻居。

第二阶段防止子社区变得非常大,这可能会降低顶点嵌入的预测能力。
第三阶段起到了排斥力的作用[68],以防止两个重叠的候选子社区向彼此扩展。当两个候选子社区高度重叠时,每个子社区内部较低的唯一性可能会降低顶点嵌入的可预测性。
与传统的GCNS或BFS不同,该设计避免了人工确定搜索深度的问题,具有两个突出特点:
(1)无需人工干预即可自动识别出结构上最相关的局部子社区;
(2)与传统的GCNS或BFS不同的是,它避免了人工确定搜索深度。为了保留结构信息,我们将子社区映射回并检索首选的基于图的顶点表示称为局部子图

stage2:局部子图张量化

作者认为在图嵌入的过程中,张量表示比传统的图嵌入更好,因为 张量表示保留了顶点的高阶拓扑结构和空间相关性,这可能产生更准确的预测。其次,长向量表示可能会受到高维的影响,导致预测的准确性降低[71]。此外,由于HINs可以通过多种链接类型分解成多个子网,而传统的向量很难完全表示这些子网,因此张量表示是一种更好的选择

得到一个包含所有子网络来表示一个顶点的局部子图之后,得到一个size为l× |E| ×max?,E代表了节点V的内在嵌入维数,其中|E|表示V的固有嵌入的维度。对于大小小于max?的子社区,用全零虚拟邻居填充张量。为了将每个子网络上的局部子图变换为|E|×max?矩阵,需要确定顶点的顺序。在这项研究中,不是通过度数、介数或特征向量中心度等典型度量对顶点进行排序[72],而是采用收敛的全局随机游走[73]来完成这项任务。
给定子网j节点为vi的子图G(V∩Ci,Lj,E),重新开始概率为α的随机游走
在这里插入图片描述A代表了图G的归一化矩阵,ps代表了在s步的概率,平稳概率可以表示为:
在这里插入图片描述其中i表示单位矩阵。由于随机游走只适用于较小的局部子图,而不适用于整个G,因此(I?αAT)?1的计算在计算上是可行的。因此,每个顶点的固定概率表示其全局重要性。然后,考虑由平稳概率确定的顶点顺序,将顶点嵌入到每个子网中的|E|×max?矩阵中,记为p*。

Stages 3 and 4: 嵌入学习和链路预测

CNN被用来从顶点张量,学习深度特征,顶点是成对的,利用提出的可优化核层来计算他们的相似度,核方法可以在原始特征空间中进行操作,它将原始特征向量隐式映射到高维特征空间。计算CNN层输出张量的子网络嵌入的核相似性。
在这里插入图片描述
特别地,顶点张量的每一行对应于子网络的嵌入。通过连接来自不同子网络的值,我们能够获得输出向量。在Eq中采用了广泛使用的RBF核函数作为核函数。
在计算成对顶点张量的相似向量之后,我们将其放入多层非线性全连接神经网络中,对目标节点进行链路预测
在这里插入图片描述
loss function is the SoftMax cross entropy
在这里插入图片描述

实验

数据集
Single-typed object HIN: WordNet,
Bipartite HIN: MovieLens 25 M,,two types of vertices, namely, users and movie(两种顶点类型),一种link类型
在这里插入图片描述
除了使用现有的链路预测算法作为基准外,还使用以下两个的建议方法以供比较:
欠缺的策略1:去除阶段1的设计,简单的选择所有的一阶邻居作为子社区

欠缺的策略2:使用所有关系子网中,所有顶点的简单连接,由于输入为向量为,故采用一维卷积核

F-1分数用作主要评估指标,即精度(某类正确预测数除以该类所有预测数)和召回率(某类正确预测数除以该类实际实例数)的调和平均值

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-10-13 11:27:11  更:2021-10-13 11:28:27 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/11 13:01:15-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码