IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> BartModel 输出变量解释(来自hugging face 网站) -> 正文阅读

[人工智能]BartModel 输出变量解释(来自hugging face 网站)

last_hidden_state :?(类型为 torch.FloatTensor ,形状?(batch_size, sequence_length, hidden_size))

模型的最后一层解码器输出的隐藏状态序列。

如果使用past_key_values,则只输出形状为(batch_size, 1, hidden_size)的序列的最后一个隐藏状态。

past_key_values? :?(tuple(tuple(torch.FloatTensor)), optional ,当use_cache=True被传递或当config.use_cache=True时返回)

长度为config.n_layers的tuple(torch.FloatTensor)的元组。 每个元组有2个张量,形状为(batch_size, num_heads, sequence_length, embed_size_per_head))和另外2个张量,形状为(batch_size, num_heads, encoder_sequence_length, embed_size_per_head)。

包含预先计算好的隐藏状态(自注意力块和交叉注意力块中的键和值),可以用来(参见past_key_values 的 输入)加速顺序解码。

decoder_hidden_states : (tuple(torch.FloatTensor), optional, 当 output_hidden_states=True被传递或config.output_hidden_states=True时返回) - torch.FloatTensor 类型的元组(一个用于嵌入的输出+一个用于每层的输出),形状为(batch_size, sequence_length, hidden_size)。

每层输出的解码器的隐藏状态加上初始嵌入的输出。

decoder_attentions?:? (tuple(torch.FloatTensor), optional, when output_attentions=True is passed or when config.output_attentions=True) - torch.FloatTensor 类型的元组(每层一个),形状为(batch_size, num_heads, sequence_length, sequence_length)。

解码器的注意力权重,在注意力计算softmax之后,用于计算自注意力头的加权平均值。

cross_attentions:? (tuple(torch.FloatTensor), optional, when output_attentions=True is passed or when config.output_attentions=True) - torch.FloatTensor 类型的元组(每层一个), 形状为?(batch_size, num_heads, sequence_length, sequence_length)

解码器交叉注意力层的注意力权重,在注意力计算softmax之后,用于计算交叉注意力头中的加权平均值。

encoder_last_hidden_state:? (torch.FloatTensor 类型张量,?形状为?(batch_size, sequence_length, hidden_size), 可选)

模型中最后一层编码器输出的隐藏状态序列。

encoder_hidden_states: (tuple(torch.FloatTensor), 可选, 当output_hidden_states=True被传递或config.output_hidden_states=True时返回) - torch.FloatTensor 类型元组(一个用于嵌入输出 ,一个用于每层输出), 形状为(batch_size, sequence_length, hidden_size)。

编码器在每层输出的隐藏状态加上初始嵌入输出。

encoder_attentions: (tuple(torch.FloatTensor), optional, when output_attentions=True is passed or when config.output_attentions=True) -?torch.FloatTensor(每层一个)的元组,?形状(batch_size, num_heads, sequence_length, sequence_length。

编码器的注意力权重,在对注意力计算 softmax 之后,用于计算自注意力头的加权平均值。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-03-24 00:32:32  更:2022-03-24 00:34:07 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 14:48:29-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码