| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 论文阅读(1):基于动态异构信息网络嵌入的新出版论文引文时间序列预测 -> 正文阅读 |
|
[人工智能]论文阅读(1):基于动态异构信息网络嵌入的新出版论文引文时间序列预测 |
论文题目:HINTS: Citation Time Series Prediction for New Publications via Dynamic Heterogeneous Information Network Embedding 论文地址:lhttps://dl.acm.org/doi/10.1145/3442381.3450107 论文来源:2021 WWW 论文源码:https://github.com/songjiang0909/HINTS_code 关键词:Citation prediction; time series; dynamic heterogeneous information network; science of science 1.前言该论文用于在动态引文网络中预测新发表论文的被引用时间序列,解决了现有方法的弊端:需要利用论文发表后前几年的引用情况作为引导值来预测后几年的引用情况。针对该问题提出了HINT框架,能够通过编码论文发表前的历史信息,从发表日期预测新论文的被引时间序列,可用于解决冷启动问题。 2.问题定义给定动态引文网络以及新发表的论文p(p不在中,学习函数f(·)预测论文p在未来L年的被引时间序列: ? ?3.模型HINTS模型图如下: 3.1 Motivation for HINTS? 这一部分介绍预测论文被引情况需要捕捉的几个因素。 第一类是metadata,异构网络中与论文实体相关的几类实体,包括论文的关键词、发表期刊、作者以及引文。 第二类是时序信息。 第三类是无形的因素fitness,比如,工作的严谨性或其贡献的价值等。 ?3.2 Dynamic Heterogeneous Network Embedding via Temporally-aligned GNN? 这一部分编码了动态异构信息网络(DHIN)中的metadata以及时序信息,学习了新论文发表前的所有时间片上所有实体的embedding。 首先在每一个静态时间片上,利用relational graph convolution network (R- GCN)来聚合不同类型的邻居信息: ?然后基于动态引文网络中各种实体变化很小的假设,提出了时序对齐的正则化项,使得相邻时间片实体的embedding更相似: 3.3 Weighted Embedding Imputation? 这一部分将各个时间片metadata的embedding进行加权得到新论文p的pseudo-leading values序列,在时间片t的pseudo-leading values计算公式如下: ? 3.4 Time Series Generator? 这一部分利用pseudo-leading values序列来推测论文未来影响力,即学习函数。 最直观的方法是利用编码器-解码器框架(例如seq2seq),但是这种方法有两个缺点:(1)解码器只能生成设定好长度的序列,不能生成灵活的长期的被引预测。(2)对于被引情况已有很多证实的假设,这种方法不能利用这些重要的假设。 该模型用对数正态分布模拟了新论文被引轨迹: 其中𝜇𝑝表示论文p到达引用峰值的时间,𝜎𝑝表示论文p引用的下降率。并且用参数𝜂𝑝模拟在3.1中讨论的“fitness”因素,所以预测的累积引用数为:? ? 三个参数𝜂𝑝,𝜇𝑝,𝜎𝑝通过pseudo-leading values?𝑉𝑝?得到,然后用来预测引用值。得到三个参数的具体过程是:首先将序列通过RNN得到一个单个向量I𝑝,然后将I𝑝分别输入到三个MLP中得到三个参数。?三个参数得到预测累积引用值后,转化为每年的预测引用值。 ?Loss函数是将预测引用值与真实值做Mean Square Error: 最终的目标函数加入了3.2中的时序对齐正则化项:? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 4:30:17- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |