General Language Understanding Evaluation (GLUE)

通用语言理解评估（GLUE）基准是用于训练、评估和分析自然语言理解系统的资源集合。
在这里插入图片描述

GLUE包括：

九个句子或句子对语言理解任务的基准，建立在已建立的现有数据集上，并选择涵盖各种数据集大小、文本类型。
诊断数据集，用于评估和分析自然语言中发现的各种语言现象的模型性能
用于跟踪基准性能的公共排行榜和用于可视化诊断集模型性能的仪表板。

GLUE基准的格式是模型不可知的，因此任何能够处理句子和句子对并生成相应预测的系统都有资格参与。选择基准任务是为了有利于使用参数共享或其他迁移学习技术在任务之间共享信息的模型。GLUE的最终目标是推动通用和健壮的自然语言理解系统的开发研究。

在这里插入图片描述

The Corpus of Linguistic Acceptability (CoLA)

Corpus of Linguistic Acceptability (CoLA) 语言可接受性语料库（CoLA），一项GLUE任务，https://gluebenchmark.com/tasks，包含数千个英文样本, 用于单句的二分类问题, 判断一个英文句子在语法上是不是可接受的。

Alex Warstadt et al. (2019)的目标是评估NLP模型的语言能力，以判断句子的语言可接受性。句子被标注为合乎语法或不合语法：

如果句子在语法上不可接受，则标签为0。
如果句子在语法上是可以接受的，则标签为1。

Classifi cation = 1 for 'we yelled ourselves hoarse.'
Classifi cation = 0 for 'we yelled ourselves.'

我们在博客自然语言处理NLP星空智能对话机器人系列：深入理解Transformer自然语言处理基于BERT模型微调实现句子分类使用了CoLA数据

#@title Loading the Dataset
#source of dataset : https://nyu-mll.github.io/CoLA/
df = pd.read_csv("in_domain_train.tsv", delimiter='\t', header=None,
names=['sentence_source', 'label', 'label_notes', 'sentence'])
df.shape

加载了预训练BERT模型

#@title Loading the Hugging Face Bert Uncased Base Model
model = BertForSequenceClassification.from_pretrained("bert-baseuncased",
num_labels=2)

使用的评估指标是Matthews Correlation Coeffi cient (MCC)

星空智能对话机器人系列博客

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

加:2021-09-23 11:28:02 更:2021-09-23 11:28:32

360图书馆购物三丰科技阅读网日历万年历 2025年7日历

-2025/7/28 10:53:46-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码

[人工智能]自然语言处理NLP星空智能对话机器人系列：深入理解Transformer自然语言处理 GLUE CoLA

目录

General Language Understanding Evaluation (GLUE)

The Corpus of Linguistic Acceptability (CoLA)

星空智能对话机器人系列博客