IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> NLP学习笔记<1> -> 正文阅读

[人工智能]NLP学习笔记<1>

????????

目录

自然语言处理任务类别

1.回归问题

2.分类问题

3.匹配问题

4.解析问题

5.生成问题

自然语言处理技术发展历史


自然语言处理(Natural Language Processing, NLP)主要研究用计算机理解和生成自然语言的各种理论和方法,属于人工智能领域的一个重要甚至核心分支,是计算机科学与语言学的交叉学科。目前机器在感知智能上的水平基本达到甚至超过了人类的水平。然而在设计自然语言处理以及常识建模和推理等研究的认知智能上,机器与人类还有很大的差距。

自然语言处理任务类别

1.回归问题

????????文本---->数值?将输入文本映射为一个连续的数值,案例如作文的打分,案件刑期或罚款金额预测,评卷等。

2.分类问题

? ? ? ? 文本---->类别 判断一个输入的文本所属的类别 ,如垃圾邮件识别,情感分析等。

3.匹配问题

? ? ? ? 文本<--->文本 判断输入文本间的关系,如文本间相似性。

4.解析问题

? ? ? ? 文本---->词语 对文本中词语进行标注或识别词语间的关系,如词性标注、句法分析、分词、命名实体识别等

5.生成问题

????????data---->文本 由输入(文本、图片、表格等)生成自然语言,如机器翻译、文本摘要、图像描述生成等

自然语言处理技术发展历史

? ? ? ? 受到预料规模以及计算能力的限制,早期的自然语言处理主要采用基于理性主义的规则方法,通过专家总结的符号逻辑知识处理通用的自然语言现象。

? ? ? ? 从二十世纪九十年代开始,随着计算机运算速度的和存储容量的快速增加,以及统计学习方法的愈发成熟,使得一语料库为核心的统计学习方法在自然语言处理领域得以大规模应用。但他也存在明显的局限性,即需要实现利用经验性规则将原始的自然语言输入转化为机器能够处理的向量行实,这一过程称为特征提取。

? ? ? ? 2010年后,随着基于深度神经网络的表示学习方法,该方法直接端到端地学习各种自然语言处理任务,不再依赖于人工设计的特征。能在多层的处理层中提炼出更高阶的关系,并利用模型内部的参数进行控制,而参数的更新值则是根据训练数据上模型的表现,使用反向传播算法进行修正。这种做法可以有向的避免统计学习方法中的人工特征提取操作,自动的发现对于目标任务有效的表示。但其致命缺点为过度以来大规模有标注数据,人力成本过于高昂,而自然语言处理的标注数据往往不够充足。

? ? ? ? 2018年以来,以BERT、GPT为代表的超大规模预训练模型恰好弥补了自然语言处理标注数据不足的缺点,帮助自然语言处理取得了一系列突破,甚至在某些方面超越了人类。

????????所谓预训练模型(Pre-train),即首先在一个原任务上预先训练一个初始模型,然后在下游任务(也称目标任务)上继续对该模型进行精调(Fine-tune),从而达到提高下游任务准确率的目的。

? ? ? ? 为了能够刻画大规模数据中复杂的语言现象,还要求所使用的深度学习模型容量足够大。基于自注意力的Transformer模型显著提升了对于自然语言的建模能力。此外也离不开以GPU、TPU为代表的线代并行计算硬件。

? ? ? ? 我们的学习也将基于预训练模型进行展开。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-10-02 14:40:59  更:2021-10-02 14:54:12 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 12:56:47-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码