IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> A Transformer-based System for English Named Entity Recognition 基于Transformer的英语命名实体识别系统 -> 正文阅读

[人工智能]A Transformer-based System for English Named Entity Recognition 基于Transformer的英语命名实体识别系统

作者:recommend-item-box type_blog clearfix

(1) ?目的和背景

① 研究任务:

? ? ? ? 复杂的复合命名实体可能是复杂的名词短语、动名词、不定式、甚至是完整的句子。这种歧义使很难根据他们的上下文认识它们为了解决复杂命名实体识别,提出了一个基于 Transformer 简单而有效的方法实现了英文命名实体识别。并且使用实体链接探索了数据增强方法,尽管该方法不能改善最终表现,但也在文中进行了讨论。

已有方法和相关工作:

????????许多先前的命名实体识别(NER)方法基于序列标签方法。 (2011年)引入了一种神经体系结构,该神经体系结构使用卷积神经网络(CNN)编码代币与CRF层相结合进行分类。许多其他研究使用复发性神经网络(RNN)来编码预测的输入和CRF。随着预训练的语言模型的最新兴起,最近的NER模型通常会使用依赖上下文的嵌入或Bert的嵌入方式。

?面临挑战:

Ⅰ虽然基于神经的模型在流行的基准数据集上取得了令人印象深刻的结果,但是这些模型通常在复杂/看不见的实体上表现不佳。

NER在复杂实体和低语情况下的挑战。其他工作将其扩展到多语言和代码混合设置。

?创新思路

Ⅰ模型没有CRF层。?

?实验结论

????????

?????????经过20个时期训练的Albert-XXLARGE在开发集中优于所有其他基线模型。因此,我们使用此模型为测试集生成预测。

(2) ?模

① BERT:该模型使用两个任务进行了预训练:掩码语言建模(MLM)和下一个句子预测(NSP)。我们在这项工作中使用了大版本的Bert(即Bert-large-uncund)

② RoBERTa:改进BERT的模型。修改包括:(1)在更多的数据上训练模型的时间更长、批量更大;(2)删除NSP目标; (3)较长序列的训练; (4)动态更改应用于训练数据的掩蔽模式。

③ ALBERT:具有两种参数还原技术,基于BERT的模型:分解嵌入参数化和跨层参数共享。(factorized embedding parameterization and cross-layer parameter sharing)

(3)? 基线模型

?

(4)? 数据增强

????????根据上述例子,首先使用一个实体链接器将提及的命名实体链接Wikidata(一个大规模的知识图)中相应的实体。在 Wikidata 页面中可以提取关于实体的所有类型的信息。可以利用这些类型的信息找到一个与原始实体不同但高度相似的新实体。所以作者试图找到一个与原始实体相同的新实体。最后,会产生一个新的例子。?

?????????

????????对于培训集中的每个示例,我们使用数据增强方法来生成一个新示例。使用了所有原始和新生成的示例来训练新的RoBERTa-large model。该模型比仅使用原始示例训练的Roberta-lagge模型表现差。尽管如此,我们仍然认为这种方法具有很大的潜力,我们对未来的工作进行了进一步的探索。

(5) ?结论和未来工作路线

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-09-24 20:57:15  更:2022-09-24 21:00:46 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/25 23:42:31-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码