| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 《自然语言处理:基于预训练模型的方法》第四章 自然语言处理中的神经网络基础--读书笔记 -> 正文阅读 |
|
[人工智能]《自然语言处理:基于预训练模型的方法》第四章 自然语言处理中的神经网络基础--读书笔记 |
多层感知器模型 1.感知器感知器(Perceptron)是最简单也是最早出现的机器学习模型,其灵感直接来源于生产生活的实践。例如,在公司面试时,经常由多位面试官对一位面试者打分,最终将多位面试官的打分求和,如果分数超过一定的阈值,则录用该面试者,否则不予录取。假设有n位面试官,每人的打分分别为,则总分,如果,则给与录取,其中被称为阈值,被称为输入,可以使用向量表示,然而,在这些面试官中,有一些经验比较丰富,而有一些是刚入门的新手,如果简单地将它们的打分进行相加,最终的得分显然不够客观,因此可以通过对面试官的打分进行加权的方法解决,即为经验丰富的面试官赋予较高的权重,而为新手赋予较低的权重。假设位面试官的权重分别为,则最终的分数为,同样可以使用向量表示n个权重,则分数可以写成权重向量和输入向量的点积,即,于是最终的输出为: 式中,输出表示录用,表示不录用。这就是感知器模型,其还可以写成以下的形式: 式中,,又被称为偏差项(Bias)。 当使用感知器模型时,有两个棘手的问题需要加以解决。 首先是如何将一个问题的原始输入(Raw Input)转换成输入向量,此过程又被称为特征提取(Feature Extraction)。在自然语言处理中,其实就是如何用数值向量表示文本。 其次是如何合理地设置权重和偏差项(它们也被称为模型参数),此过程又被称为参数学习(也称参数优化或模型训练) 很多现实生活中遇到的问题都可以使用感知器模型加以解决,比如识别一个用户评论句子的情感极性是褒义还是贬义等,在自然语言处理中,这些问题又被归为文本分类问题。 2.线性回归上一小节介绍的感知器是一个分类模型,即输出结果为离散的类别(如褒义或贬义)。 除了分类模型,还有一大类机器学习模型被称为回归(Regression)模型,其与分类模型的本质区别在于输出的结果不是离散的类别,而是连续的实数值。 在实际生活中,回归模型也有大量的应用,如预测股票的指数,天气预报中温度的预测等。类似地,在情感分析中,如果目标不是预测文本的情感极性,而是一个情感强弱的分数,如电商或影评网站中用户对商品或电影的评分等,则是一个回归问题。 线性回归(Linear Regression)是最简单的回归模型。与感知器类似,线性回归模型将输出建模为对输入中各个元素的线性加权和,最后也可以再加上偏差项,即 3.Logistic回归线性回归输出值的大小(值域)是任意的,有时需要将其限制在一定的范围内。有很多函数能够实现此功能,它们又被称为激活函数(Activation Function),其中Logistic函数经常被用到,其形式为: 该函数能将的值限制在到之间,当时,;控制了函数的陡峭程度。若,此模型又被称为Logistic回归(Logistic Regression)模型。 虽然被称为回归模型,但是Logistic回归经常被用于分类问题。这是如何做到的呢?如果将Logistic函数中的参数进行如下设置。、、,此时函数形式为: 该函数又被称为Sigmoid函数, 其值域恰好在0~1之间,所以经过Sigmoid函数归一化的模型输出可以看作一个输入属于某一类别的概率值(假设只有两个类别,因此也被称为二元分类问题) 除了可以输出概率值,Sigmoid函数另一个较好的性质是其导数比较容易求得(),这为后续基于梯度的参数优化算法带来了一定的便利。 4.Softmax回归Sigmoid虽然可以用于处理二元分类问题,但是很多现实问题的类别可能不止两个,如手写数字的识,输出属于0~9共10个数字中的一个,即有10个类别。在自言语言处理中,如文本分类、词性标注等问题,均属于多元分类问题,即使是情感极性识别也一样,除了褒义和贬义,还可以增加一个中性类别。那么,如何处理多元分类问题呢?其中一种方法和Sigmoid回归的思想类似,即对第个类别使用线性回归打一个分数,。式中,表示第个类别对应的第个输入的权重,然后,对多个分数使用指数函数进行归一化计算,并获得一个输入属于某个类别的概率。该方法又称为Softmax回归,具体公式为: 式中,表示向量;表示类别数;表示第个类别的概率。 当m=2时,即处理二元分类问题时,可以写为: 此公式即Sigmoid函数形式,也就是Sigmoid函数是Softmax函数在处理二元分类问题时的一个特例。 进一步地,将Softmax回归模型公式展开,其形式为: 可以使用矩阵乘法形式重写该公式: 更进一步地,可以使用张量表示输入、输出以及其中的参数,即: 式中,,,,。对向量执行运算又被称为对进行线性映射或线性变换。 5.多层感知器多层感知器(Multi-layer Perceptron,MLP)是解决线性不可分问题的一种解决方案。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/11 8:59:25- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |