IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 图与网络汇报 scaled_dot_product_attention -> 正文阅读

[人工智能]图与网络汇报 scaled_dot_product_attention

具体来说,给定节点特征 H ( l ) = h 1 ( l ) 、 h 2 ( l ) 、 . . . , h n ( l ) H^{(l)}={h^{(l)}_1、h^{(l)}_2、...,h^{(l)}_n} H(l)=h1(l)?h2(l)?...hn(l)?,我们计算从 j j j i i i的每条边的multi-head attention如下:

在这里插入图片描述
对于第C个head attention,,我们首先使用不同的可训练参数,将源特征 h i ( l ) h^{(l)}_i hi(l)?、终点特征 h j ( l ) h^{(l)}_j hj(l)?转换为query vector q c , i ( l ) q^{(l)}_ {c,i} qc,i(l)?,key vector k c , j ( l ) k^{(l)}_{c,j} kc,j(l)?,分别使用不同的可训练参数 W c , q ( l ) W^{(l)}_{c,q} Wc,q(l)? W c , k ( l ) W^{(l)}_{c,k} Wc,k(l)? b c , q ( l ) b^{(l)}_{c,q} bc,q(l)? b c , k ( l ) b^{(l)}_{c,k} bc,k(l)?
所提供的边缘特征 e i j e_{ij} eij?将被编码并添加到关键向量中,作为每个层的附加信息
在得到了图的多头关注后,我们进行了从终点j到源点i的一个消息聚合。
在这里插入图片描述
其中, ∣ ∣ || 是C头注意的连接操作,
此外,我们使用层间的门控残差连接以防止我们的模型过度平滑。
在这里插入图片描述

我们通过简单地将节点特征和标签向量相加,作为传播信息 H 0 = X + Y d H_0=X+Y_d H0?=X+Yd?,将标签传播结合到图变换器中。我们的模型在一个共享的消息传递框架中统一了标签传播和特征传播。
在这里插入图片描述
下面是整个图形的流程:
1.V,K,Q是一个三维矩阵 ( 1 ? 10 ? 512 ) (1*10*512) 1?10?512

2.然后将Q在最后一维上进行切分为num_heads(假设为8)段,然后对切分完的矩阵在axis=0维上进行concat链接起来;对V和K都进行和Q一样的操作;操作后的矩阵记为Q_,K_,V_; ( 8 ? 10 ? 64 ) (8*10*64) 8?10?64
在这里插入图片描述
3. Q_矩阵相乘 K_的转置(对最后2维),生成结果记为outputs,然后对outputs 进行scale一次更新为outputs。 ( 8 ? 10 ? 64 ) ? ( 8 ? 64 ? 10 ) = ( 8 ? 10 ? 10 ) (8*10*64)*(8*64*10)=(8*10*10) 8?10?64?(8?64?10=(8?10?10)
在这里插入图片描述
4.对outputs进行softmax运算,更新outputs,即outputs=softmax(outputs);
5.最新的outputs(即K和Q的相关性) 矩阵相乘 V_, 其值更新为outputs;
( 8 ? 10 ? 10 ) ? ( 8 ? 10 ? 64 ) = ( 8 ? 10 ? 64 ) (8*10*10)*(8*10*64)=(8*10*64) (8?10?10)?(8?10?64)=(8?10?64)
在这里插入图片描述
6.最后将outputs在axis=0维上切分为num_heads段,然后在axis=2维上合并, 恢复原来Q的维度; ( 1 ? 10 ? 512 ) (1*10*512) (1?10?512)
在这里插入图片描述

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-06 23:10:15  更:2022-04-06 23:10:38 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 11:24:46-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码