IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 自然语言处理NLP星空智能对话机器人系列:深入理解Transformer自然语言处理 GLUE CoLA -> 正文阅读

[人工智能]自然语言处理NLP星空智能对话机器人系列:深入理解Transformer自然语言处理 GLUE CoLA

自然语言处理NLP星空智能对话机器人系列:深入理解Transformer自然语言处理 GLUE CoLA


Transformer下游任务继承了模型和来自预训练transformer模型的参数,模型将不断发展,数据库、基准方法、精度测量也将不断发展.

General Language Understanding Evaluation (GLUE)

通用语言理解评估(GLUE)基准是用于训练、评估和分析自然语言理解系统的资源集合。
在这里插入图片描述
在这里插入图片描述

GLUE包括:

  • 九个句子或句子对语言理解任务的基准,建立在已建立的现有数据集上,并选择涵盖各种数据集大小、文本类型。
  • 诊断数据集,用于评估和分析自然语言中发现的各种语言现象的模型性能
  • 用于跟踪基准性能的公共排行榜和用于可视化诊断集模型性能的仪表板。

GLUE基准的格式是模型不可知的,因此任何能够处理句子和句子对并生成相应预测的系统都有资格参与。选择基准任务是为了有利于使用参数共享或其他迁移学习技术在任务之间共享信息的模型。GLUE的最终目标是推动通用和健壮的自然语言理解系统的开发研究。

在这里插入图片描述

The Corpus of Linguistic Acceptability (CoLA)

Corpus of Linguistic Acceptability (CoLA) 语言可接受性语料库(CoLA),一项GLUE任务,https://gluebenchmark.com/tasks,包含数千个英文样本, 用于单句的二分类问题, 判断一个英文句子在语法上是不是可接受的。

Alex Warstadt et al. (2019)的目标是评估NLP模型的语言能力,以判断句子的语言可接受性。句子被标注为合乎语法或不合语法:

  • 如果句子在语法上不可接受,则标签为0。
  • 如果句子在语法上是可以接受的,则标签为1。
Classifi cation = 1 for 'we yelled ourselves hoarse.'
Classifi cation = 0 for 'we yelled ourselves.'

我们在博客自然语言处理NLP星空智能对话机器人系列:深入理解Transformer自然语言处理 基于BERT模型微调实现句子分类 使用了CoLA数据

#@title Loading the Dataset
#source of dataset : https://nyu-mll.github.io/CoLA/
df = pd.read_csv("in_domain_train.tsv", delimiter='\t', header=None,
names=['sentence_source', 'label', 'label_notes', 'sentence'])
df.shape

加载了预训练BERT模型

#@title Loading the Hugging Face Bert Uncased Base Model
model = BertForSequenceClassification.from_pretrained("bert-baseuncased",
num_labels=2)

使用的评估指标是Matthews Correlation Coeffi cient (MCC)

星空智能对话机器人系列博客

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-09-23 11:28:02  更:2021-09-23 11:28:32 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/21 19:23:36-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码