[人工智能] Hierarchical Attention Networks for Document Classification阅读报告

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> Hierarchical Attention Networks for Document Classification阅读报告 -> 正文阅读

[人工智能]Hierarchical Attention Networks for Document Classification阅读报告

HAN网络：

按照我的理解HAN网络是用于文本分类的，是对文本的一个向量表示。但表示过程是层次化的。

摘要

HAN网络有两大特点，1HAN是层次化的模型，可以暗示了文本本身具有的层次化特征2.使用了两级注意力机制，允许关注更重要的信息。在六个大型分类任务上都取得了良好的成绩。

介绍

文本分类是NLP的基本任务。目标是为一个文本联系一个标签。传统分类方法基于稀疏的从词特征，比如n_gram，再放入SVM中。如今神经网络已经在其中大规模应用。
虽然神经网络方法已经足够有效，但这篇文章表名，如果把文本结构集成到网络模型这种可以获得更好的结果。这篇文章动机在于，并非文档的所有部分都与回答问题同等相关，相关性涉及对单词的相互作用进行建模，而不仅仅是孤立的单词存在。
主要贡献是提出了一种新网络结构，层次注意力网络，来捕获两种在文档结构中洞察到的领悟。1.因为文档是层次化的，我们先建立构建文档的句子表示，在构建词表示。2.不同的词和句子在文档中信息不同，词和句子的意思高度依赖于上下文，同样的词在不同的句子中可能有不同的重要性。为了获取这个信息，我们使用了两层注意力模型，一层在单词级，一层在句子级。让模型能够更集中注意力在单词个体和句子个体。
与以前工作的关键区别在于，HAN使用上下文来发现序列何时相关，而不是简单地从上下文中筛选。