语义分析
??语义分析(Semantic Analysis)的目的是为含义完整的话语分配含义,包含单词的含义和单词含义的组合。语义分析的任务可以分为几个子任务,这取决于它所发生的语言水平。
??最重要的子任务是歧义词和短语的语义标注(Semantic Role Labeling)、指代消解。除此之外,我们还会介绍情感分析任务和单位的向量化(word2vec)。
语义角色标注
??Semantic Role Labeling是根据一组预先定义的关系来识别和标注句子中语义谓词的角色,比如,“who” did “what” to “whom”。
??语义谓词-论元结构的两种形式:
- 基于成分的 (Constituent-based)
- 例如:[Marray]A0 [borrowed]v [a book]A1 [from John]A2 [last week]AM-TMP
- 基于依存的 (Dependency-based)
- 例如:[Marray]A0 [borrowed]v a [book]A1 from [John]A2 last [week]AM-TMP
??四个子任务:
指代消解
??指代消解是找出文本中名词短语所指代的真实世界中的事物。不只是代词能够指代其他事物,所有格和其他名词性短语也可以。甚至还存在大量嵌套的指代。
日常应用:
情感分析
??情感分析是用来识别文本的情绪。它也被用来识别情感没有明确表达的地方。
??很多公司使用情绪分析,识别在线客户的意见和情绪。它将帮助公司了解客户对产品和服务的看法。企业可以通过情感分析从客户的帖子中判断自己的整体声誉。这样,我们可以说,除了确定简单的极性之外,情感分析还可以理解上下文中的情绪,以帮助我们更好地理解所表达的观点背后的含义。
单词的向量化
??word2vec是word embedding(词向量)的一种浅层神经网络训练方法。通俗的讲就是把一个词变成一个词向量。
|