IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 基于BERT模型的舆情分类应用研究-笔记 -> 正文阅读

[人工智能]基于BERT模型的舆情分类应用研究-笔记

14天阅读挑战赛

基于BERT模型的舆情分类应用研究-笔记

一、模型介绍

本文工作:在预训练的BERT模型基础上进行结构的微调,将其适应于文本分类任务。

1.Transformer编码器

2013年Word2Vec通过连续词袋模型CBOW和连续Skip-gram模型进行训练。

CBOW:将一个句子中的一个词进行掩盖,通过神经网络介绍上下文词去预测被掩盖的词,通过神经网络计算出该词的词向量表征。原理类似于(人们阅读文本时发现某个词不认识,但可以通过上下文的语境含义去推测出该词的大致意思)

但后来人们发现了Word2Vec的缺点:无法解决多义词。针对该缺点,有学者提出新的表示词嵌入方法—ELMO,该模型利用预训练的词嵌入模型的基础上利用长短期记忆网络编码单词的上下文,调整单词的Embedding编码表示动态的具备了上下文语义。
在这里插入图片描述ELMO模型,句子中的每一个单词经过三层编码:嵌入层为单词原始的词向量表示,之后是第一层正向LSTM中对应的词汇编码,主要蕴含句法信息;最后是第二层反向LSTM中对应词汇编码,这层主要蕴含语义信息。通过给予三层各一个权重,将编码结果乘以各自权重累加求和,得到ELMO的输出。

BERT模型在ELMO模型之后提出,它与ELMO并无二致,根本的改变在于BERT使用的Transformer编码器代替了原先的LSTM。
在这里插入图片描述
Transformer外部结构,由6个编码器和6个解码器堆叠而成,它接收序列数据,并且输出序列数据,经过6个编码器处理后的数据会分别输入6个解码器进行解码。
在这里插入图片描述
每一个Encoder的内部构造完全相同,但参数不会共享,主要由两部分组成:自注意力层(self-attention)和前馈神经网络层(Feed Forward Neural Network)
每一个Decoder也有类似的内部结构,比Encoder多一个编码-解码注意力层,目的是帮助Decoder重点关注句子中某个关键词语,而忽略其他相关程度较低的词。
在这里插入图片描述
self-attention具体的执行流程,可以参考博客
在这里插入图片描述
计算公式
在这里插入图片描述
Bert模型执行流程:
Bert模型采用多头注意力机制(Multi-headed Attention),相较于self-attention,它为attention层提供了多个表示子空间(Representation Subspaces),拓展了模型关注不同位置的能力。每个注意力头(header)都分配了一个Query、Key、Value权重矩阵。这些权重矩阵在训练开始时随机生成,通过训练来自较低层的Encoder/Decoder的矢量投影到不同的表示子空间。

对于每一个注意力头,通过上述公式,计算得到相应的关照程序向量Z0,Z1,…,Z7,将8个向量拼接之后乘以矩阵W0,得到最终的注意力矩阵Z。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

二、实验介绍

采用微博舆情数据共14大类:民生、文化、娱乐、体育、财经、房产、汽车、教育、科技、军事、旅游、国际、农业、电竞。
在这里插入图片描述
在这里插入图片描述
作者将他提出的Bert的fine-turning训练记录与双向LSTM链接的CNN模型训练记录进行对比,作者的改进在训练数据集上表现出较好的F1值、精确度和召回率。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-10-22 21:15:35  更:2022-10-22 21:18:06 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/19 22:42:22-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码