[人工智能] Re23：读论文 How Does NLP Benefit Legal System: A Summary of Legal Artificial Intelligence

本文是2020年ACL论文，是legalAI领域的综述，主要关注近年（2018年以来）的数据驱动、基于表征学习的NLP方法（有缺乏可解释性、有性别偏见和种族歧视等道德隐患的问题），并对要素识别、案例判决、相似案例匹配和legalQA任务的SOTA方法进行了实现和分析（实现代码和数据集都可以在GitHub项目中找到）。
作者来自清华。
我感觉这篇文章写得不错，但是总结还是不够全面，而且也不够新。但是作者的思维非常深刻，对领域的理解比我好，学习了！

1. Background

legalAI可以将法律从业者从海量的文书工作中解放出来，传统legalAI方法是基于规则（结构化预测方法）或者符号（手工抽取可解释的符号，应用可解释的法律知识在事件、关系等法律文书的符号间推理）的。
legalAI所采用的文本材料有判决文书、合同、法律意见书（legal opinion）等。legalAI对可解释性天然有高要求。

2. 基于表征的方法

2.1 字、词、概念嵌入

很难直接从法律事实描述中学习专业术语，当前工作¹ ²主要关注法律专业领域应用现存嵌入方法（如word2vec）。
知识图谱方法有两大挑战：第一，构建法律领域知识图谱很复杂，很多场景下没有可用的知识图谱，所以要从0开始构建。而且不同法律概念可能在不同国家的法律体系下有不同的表示和意义，因此很难构建通用的法律知识图谱。有些工作尝试嵌入法律词典³。第二，通用法律知识图谱可能会和NLP中通用的形式不同，因为通用知识图谱关注实体和概念之间的关系，但legalAI更关注对法律概念的解释。

2.2 预训练语言模型

由于法律文本中存在特有的术语和知识，因此不宜直接使用通用预训练模型。⁴提出了中文民法和刑法文档上训练得到的预训练模型。
未来研究者可以考虑在PLMs中加入知识，这有助于法律概念之间的推理能力。

3. 基于符号的方法

利用法律领域符号和知识（事件和关系，能提供可解释性）解决legalAI任务。可以使用深度学习方法来提高表现效果

3.1 信息抽取

抽取出来的符号具有legal basis，可以为司法应用提供可解释性，因此我们不能只关注方法的表现效果。

3.2 法律要素抽取

除了上述在通用NLP中也存在的符号外，legalAI还有其独有的符号：法律要素。如是否某人被杀或某物被盗，这些要素被称为犯罪构成要素constitutive elements of crime。
这些要素可以提供法律判决预测的中间监督信息和预测结果的可解释性。

中文数据集：CAIL2019-fe（多标签分类任务）
在这里插入图片描述

（图中BERT-MS是把BERT换成了⁴，体现了domain-specific预训练模型的优势）

4. legalAI应用

4.1 legal judgment prediction (LJP)

在民法法系中，使用案例事实描述信息和法条文本来预测结果。

在CAIL上的实验结果：
在这里插入图片描述

micro-F1和macro-F1之间的差距证明模型在低频标签上表现不好。⁸探索了LJP的few-shot learning，但是需要额外手工标注attribute信息，耗时太久，且难以泛化到其他数据集上。
BERT表现不好的主要原因在法律文本偏长，但BERT的最长输入长度仅为512。话说现在可以用lawformer这个长文本预训练模型了，不知道效果会不会有提升。
TopJudge模型可证明结合基于符号的方法有效果提升。

4.2 相似案例匹配Similar Case Matching (SCM)

在普通法系中很重要。
从事实、时间和要素级别以不同粒度建模案例关系，属于语义匹配任务¹⁰。

传统IR方法使用统计学方法，关注术语级别的相似性：TF-IDF和BM25
结合元信息捕获语义相似性¹¹
使用机器学习方法，如SVD或因式分解
使用神经网络模型，如多层感知机、CNN、RNN

¹⁰声称，法律专家认为数据集中的要素定义了案例相似性，仅考虑术语和语义相似性是不够的。

4.3 legalQA (LQA)

有的问题关注法律概念的解释，有的关注特定案例的分析。可能由专业人员或非专业人员提出（尤其在描述领域术语上会有差异）。

数据集：
CJRC¹⁴：与SQUAD 2.0形式相同，包含span extraction、判断题和没有回答的问题。
COLIEE¹²：包含500道判断题。
美国法考：Passing a USA National Bar Exam: a First Corpus for Experimentation
中国法考：JEC-QA¹⁵，多选题，包含knowledge-driven questions (KD-Questions) and case-analysis questions (CA-Questions)两种问题

5. 其他

6. 代码复现

Deep learning in law: early adaptation and legal word embeddings trained on large corpora ??
Gov2Vec: Learning Distributed Representations of Institutions and Their Legal Text ??
Legal electronic dictionary for Czech ??
Open chinese language pretrained model zoo 事实上是这个GitHub项目：thunlp/OpenCLaP: Open Chinese Language Pre-trained Model Zoo ?? ??
End-to-end relation extraction (端到端的信息抽取) 旨在抽取实体和实体之间的关系；
Joint Model 同时处理这两个任务，即对一句话同时抽取出实体和关系；而联合模型又分为2类：
结构化预测框架
共享参数的多任务学习

参考资料：[PAPER]Joint Model的挑战 - 知乎 ??
Iteratively Questioning and Answering for Interpretable Legal Judgment Prediction ??
Legal Judgment Prediction via Topological Learning ?? ??
Few-Shot Charge Prediction with Discriminative Legal Attributes ?? ??
CAIL2018: A Large-Scale Legal Dataset for Judgment Prediction ??
CAIL2019-SCM: A Dataset of Similar Case Matching in Legal Domain ?? ?? ??
我也不知道什么是元信息 ??
COLIEE-2018: Evaluation of the Competition on Legal Information Extraction and Entailment ?? ??
A test collection for evaluating legal case law search ??
Cjrc: A reliable human-annotated benchmark dataset for chinese judicial reading comprehension ??
JEC-QA: A Legal-Domain Question Answering Dataset ?? ??