本篇不具体谈技术,主要是总结在事件抽取方向的相关调研结果。
1. 事件抽取-厂商
(1) 领域范畴:厂商无论是在特定领域(如:法律、金融),还是通用领域,厂商做的都是限定类型的事件抽取。
(2)范式:除标准抽取外(即事件检测和事件论元识别),还有:
(3)技术栈:
- 预训练语言模型+(BiLSTM)+CRF
- 预训练语言模型+MRC
- 预训练语言模型+Biaffine
- Bert+BiLSTM+Self-Attention+Pointer Network
- 预训练语言模型+指针结构+CLN(ConditionalLayerNorm)等
1.1 华为云
1.2 百度
需要指出的是,通用属性抽取的问题是无法灵活的泛化。MRC(阅读理解方案)的问题则是效率,因为需要对每一个角色都进行单独提问抽取。
1.3 科大讯飞
无,但科大讯飞有举办相关比赛,这里有一份参赛者的分享 科大讯飞2020完整事件抽取系统。
1.4 深擎科技
在他们主页上没有找到相关接口,但是找到一篇他们分享的文章结合指针网络的注意力机制(PAN模型)实现金融领域事件抽取。这篇文章里主要提及了事件主体识别 和事件类型判定 :
1.5 幂律智能
-
领域范畴 法律方向,分析对象主要为裁判文书、案件卷宗等法律描述文本 -
范式(非标准事件抽取) 主要抽取出独立的包含时间、人物、地点、描述的子事件 -
技术栈 基于深度学习的序列标注模型,从探测出的事件片段中预测出时间、地点、任务、描述信息
值得注意的是,他们还有一个时间线(类似于事件脉络),主要是通过提取出的时间标准化比对。
1.6 云孚语义
有,而且已经有了事件脉络(我计划将要做的😂,别人已经有了),但是目前没有看到它的主页有演示接口,仅看到它的微信公众号文章中的展示。
2.后续
后续将会出事件抽取方向调研-技术栈篇等内容。
|