IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> allennlp.modules.span_extractors -> 正文阅读

[人工智能]allennlp.modules.span_extractors

allennlp.modules.span_extractors.span_extractor.SpanExtractor

就是个基类
需要自己另外写函数,得到所有的span_indices,不过也简单。
Many NLP models deal with representations of spans inside a sentence. SpanExtractors define methods for extracting and representing spans from a sentence.
许多NLP模型处理句子中的span表示。SpanExtractors定义了从句子中提取和表示span的方法。

SpanExtractors take a sequence tensor of shape (batch_size, timesteps, embedding_dim) and indices of shape (batch_size, num_spans, 2) and return a tensor of shape (batch_size, num_spans, …), forming some representation of the spans.

SpanExtractors接受的序列张量的形状(batch_size, timesteps, embedding_dim)和目录的形状(batch_size, num_span, 2),并返回形状为(batch_size, num_span,…)的张量,形成span的一些表示。timesteps就是句子长度 2是什么,是pair(start,end)

forward(self, sequence_tensor: torch.FloatTensor, span_indices: torch.LongTensor, sequence_mask: torch.LongTensor = None, span_indices_mask: torch.LongTensor = None)
Given a sequence tensor, extract spans and return representations of them. Span representation can be computed in many different ways, such as concatenation of the start and end spans, attention over the vectors contained inside the span

给定一个序列张量,提取span并返回它们的表示。span表示可以通过许多不同的方式来计算,例如开始span和结束span,包含span内部的vector的attention,等等。
参数如下:

sequence_tensortorch.FloatTensor, required.
A tensor of shape (batch_size, sequence_length, embedding_size) representing an embedded sequence of words.  sentence的表示

span_indicestorch.LongTensor, required.
A tensor of shape (batch_size, num_spans, 2), where the last dimension represents the inclusive start and end indices of the span to be extracted from the sequence_tensor.   2对应的span在原序列start,end的位置。

sequence_mask torch.LongTensor, optional (default = None).
A tensor of shape (batch_size, sequence_length) representing padded elements of the sequence.

span_indices_mask torch.LongTensor, optional (default = None).
A tensor of shape (batch_size, num_spans) representing the valid spans in the indices tensor. This mask is optional because sometimes it’s easier to worry about masking after calling this function, rather than passing a mask directly.

返回值:

A tensor of shape (batch_size, num_spans, embedded_span_size),where embedded_span_size depends on the way spans are represented.

两个内置函数

get_input_dim(self) → int[source]
Returns the expected final dimension of the sequence_tensor.

get_output_dim(self) → int[source]
Returns the expected final dimension of the returned span representation.

EndpointSpanExtractor

不用注意力加权就用这个
allennlp.modules.span_extractors.endpoint_span_extractor.EndpointSpanExtractor(input_dim: int, combination: str = ‘x, y’, num_width_embeddings: int = None, span_width_embedding_dim: int = None, bucket_widths: bool = False, use_exclusive_start_indices: bool = False)
将span表示为其端点的enbedding的组合。此外,span的宽度可以embbed并连接到最终的组合。
支持以下表示类型,假设x = span_start_embeddings和y = span_end_embeddings。
x, y, X y, X +y, X -y, X /y,每一个二进制操作都以elementwise方式执行。您可以列出任何您想要的组合,逗号分隔。例如,您可以将x、y、xy作为该类的组合参数。计算出的相似度函数将是[x;y;X *y],然后可以有选择地将其与span宽度的embedding表示连接起来。
参数说明

input_dimint, required.
The final dimension of the sequence_tensor.  维度的大小,input.shape[-1]

combination str, optional (default = “x,y”).
The method used to combine the start_embedding and end_embedding representations. See above for a full description.

num_width_embeddings int, optional (default = None).
Specifies the number of buckets to use when representing span width features. span的最大长度

span_width_embedding_dimint, optional (default = None).
The embedding size for the span_width features. 想把width embed成多少维

use_exclusive_start_indicesbool, optional (default = False).
If True, the start indices extracted are converted to exclusive indices. Sentinels are used to represent exclusive span indices for the elements in the first position in the sequence (as the exclusive indices for these elements are outside of the the sequence boundary) so that start indices can be exclusive. NOTE: This option can be helpful to avoid the pathological case in which you want span differences for length 1 spans - if you use inclusive indices, you will end up with an x - x operation for length 1 spans, which is not good. 想让span的头不重复就设置成true



bucket_widths bool, optional (default = False).
Whether to bucket the span widths into log-space buckets. If False, the raw span widths are used.
from allennlp.modules.span_extractors import EndpointSpanExtractor
#模型实例化,对应init函数
es=EndpointSpanExtractor(seq.shape[-1], "x,y,x*y")
#使用模型,对应forward函数
output=es(torch.FloatTensor(seq),torch.LongTensor(indice))
print(output.shape)
输出:torch.Size([5, 3, 30])
最后一个维度是input_dim*combination的长度(10*3=30)

SelfAttentiveSpanExtractor

想注意力加权就用这个,就是要加个注意力

allennlp.modules.span_extractors.self_attentive_span_extractor.SelfAttentiveSpanExtractor(input_dim: int)

通过为文档中的每个单词生成非标准化的注意力分数来计算span表示。span表示是通过规范化span内单词的attention分数来计算这些分数的。
给定每个跨度上的这些注意力分布,这个模块用这个分布对跨度中单词的相应向量表示进行加权,返回每个跨度的加权表示。
给定一个序列张量,提取span并返回它们的表示。空间表示可以通过许多不同的方式来计算,例如连接开始和结束空间,关注包含在空间内的向量,等等。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-07-03 10:48:33  更:2022-07-03 10:51:32 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/12 6:12:22-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码