IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 事件抽取相关调研-厂商篇 -> 正文阅读

[人工智能]事件抽取相关调研-厂商篇

本篇不具体谈技术,主要是总结在事件抽取方向的相关调研结果。

1. 事件抽取-厂商

(1) 领域范畴:厂商无论是在特定领域(如:法律、金融),还是通用领域,厂商做的都是限定类型的事件抽取

(2)范式:除标准抽取外(即事件检测和事件论元识别),还有:

  • 仅抽取触发词和论元

  • 仅抽取事件类型和论元

    在论元抽取上也各不相同,有的仅抽取主体,有的抽取通用属性(如:时间/地点,或者时间/地点/主体/客体)等。

(3)技术栈

  • 预训练语言模型+(BiLSTM)+CRF
  • 预训练语言模型+MRC
  • 预训练语言模型+Biaffine
  • Bert+BiLSTM+Self-Attention+Pointer Network
  • 预训练语言模型+指针结构+CLN(ConditionalLayerNorm)等

1.1 华为云

  • 领域范畴

    华为云/自然语言处理服务接口说明/事件抽取目前只支持金融公告中的会议召开、聘任、辞职、股票增持、股票减持5类事件以及相关要素的抽取。

  • 范式(标准事件抽取)

    包括事件检测(触发词抽取?事件类型判定)
    事件论元识别(论元抽取?论元角色判定)

  • 技术栈

    未找到直接描述,但找到了华为云作为CCKS 2020篇章事件要素抽取比赛冠军的方案解析,但注意这个比赛不属于标准的事件抽取。
    整体框架图
    事件类型预测图
    事件要素抽取图
    上图分别是他们的整体框架图和子模型图,他们将这个任务拆解了三个子任务:事件类型预测事件要素抽取,以及事件表格填充。值得关注的是在论元提取(要素抽取)阶段,除了CRF外,他们也尝试了MRC(阅读理解范式)、Biaffine。其中Biaffine思想来自论文Named Entity Recognition as Dependency Parsing。另外在最后表格填充时,他们也采用了特殊处理

1.2 百度

  • 领域范畴

    百度AI/知识图谱/事件图谱/事件属性抽取从资讯的标题与正文中,抽取事件发生时间地点参与者触发词等事件元素。应该未限定领域范畴。

  • 范式和技术栈

    未找到直接描述,但可从其报告百度: 事件图谱技术与应用分析:

    • 通用属性抽取针对时间、地点、参与者、触发词进行抽取,采用的是实体识别常用的预训练语言模型(ERNIE)+BiLSTM+CRF
      在这里插入图片描述
    • 自定义论元抽取采用MRC(阅读理解) 方式,将抽取转换成问答形式,通过问题嵌入要抽取的目标,如某角色的论元,来解耦了模型与事件类型、角色类型的相关部分;
      在这里插入图片描述
    • 语义角色抽取和目前我实验所采用的范式一样,都是层叠指针结构。另外因为不同类型事件有各自的论元角色,如果全部建模到模型中,模型会变得很复杂,所以百度将所有角色分门别类,如主体、客体等等(这里百度称为语义角色),然后利用多层指针结构同时抽取。
      在这里插入图片描述

需要指出的是,通用属性抽取的问题是无法灵活的泛化。MRC(阅读理解方案)的问题则是效率,因为需要对每一个角色都进行单独提问抽取。

1.3 科大讯飞

无,但科大讯飞有举办相关比赛,这里有一份参赛者的分享
科大讯飞2020完整事件抽取系统

  • 范式

    非标准的事件抽取,任务包括:抽取触发词主体/客体/时间/地点,判定事件发生状态的属性包括极性、时态。极性分为:肯定、否定、可能;时态分为:过去、现在、将来、其他。

  • 技术栈(pipeline)

    • 触发词抽取
      Bert+指针结构,(特征层面:<远程监督>增加了已知的所有触发词的嵌入)
      在这里插入图片描述
    • 主体/客体/时间/地点抽取
      Bert+conditionalLayerNorma+指针结构,(特征层面:trigger在文本中的位置、其他词到trigger的位置)
      在这里插入图片描述

1.4 深擎科技

在他们主页上没有找到相关接口,但是找到一篇他们分享的文章结合指针网络的注意力机制(PAN模型)实现金融领域事件抽取。这篇文章里主要提及了事件主体识别事件类型判定

  • 事件类型判定

    金融事件的特征相对明显,业务术语等很大程度上决定了分类的效果,他们直接采用Fasttext分类模型,在句子级的事件识别任务中达到了95.7%的准确率。

  • 事件主体识别
    采用了基于指针网络带注意力机制(PAN,Point Attention Network:Bert+BiLSTM+Self-Attention+Pointer Network)的事件主体识别模型,从文本中找出在事件中充当的主体角色元素。

1.5 幂律智能

在这里插入图片描述

  • 领域范畴

    法律方向,分析对象主要为裁判文书案件卷宗等法律描述文本

  • 范式(非标准事件抽取)

    主要抽取出独立的包含时间、人物、地点、描述的子事件

  • 技术栈

    基于深度学习的序列标注模型,从探测出的事件片段中预测出时间、地点、任务、描述信息

值得注意的是,他们还有一个时间线(类似于事件脉络),主要是通过提取出的时间标准化比对。
在这里插入图片描述

1.6 云孚语义

有,而且已经有了事件脉络(我计划将要做的😂,别人已经有了),但是目前没有看到它的主页有演示接口,仅看到它的微信公众号文章中的展示

在这里插入图片描述

2.后续

后续将会出事件抽取方向调研-技术栈篇等内容。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-09-09 11:45:02  更:2021-09-09 11:45:31 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 15:43:39-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码