IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 自然语言处理总复习(七)—— 概率上下文无关文法 -> 正文阅读

[人工智能]自然语言处理总复习(七)—— 概率上下文无关文法

一、背景介绍

(一)问题提出

自然语言是一种非线性的符号序列,句子结构的表现为复杂的嵌套性。
N-gram 和 HMM 模型只能处理线性序列,分析过程中就会面临一些问题。

(二)上下文无关文法(CFG)

在这里插入图片描述

二、概率上下文无关文法(PCFG)

(一)定义

在这里插入图片描述

(二)符号定义

在这里插入图片描述

(三)应用举例

1. 举例

在这里插入图片描述
在这里插入图片描述

2. 规则的概率估计

以上计算过程中,规则的概率计算方法如下:
前提: 有一个树库,对语料库中的每个句子都正确标记了句法分析树,称之为树库。
(从规模和可读性上来讲,应用最广泛的树库是Penn(滨州)树库)
在这里插入图片描述

Penn树库

在这里插入图片描述
在这里插入图片描述

(四)PCFG的基本问题

1. 给定一个语法,如何计算一个句子的概率? P ( w 1 m ∣ G ) P(w_{1m}|G) P(w1m?G)

(1)相关定义

外部概率(outside probability):
对应HMM中的前向变量。 α j ( p , q ) \alpha_j(p, q) αj?(p,q)
内部概率(inside probability):
对应HMM中的后向变量。 β j ( p , q ) \beta_j(p, q) βj?(p,q)
在这里插入图片描述

(2)利用内部概率计算句子概率

a)内部算法 —— 基于内部概率的动态规划算法
  • 定义

在这里插入图片描述
在这里插入图片描述

  • 推导
    在这里插入图片描述
    在这里插入图片描述
b)内部算法 —— 举例

在这里插入图片描述

(3)利用外部概率计算句子概率

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

举例:
在这里插入图片描述

2. 已知语法,如何计算一个句子最可能的分析树 P ( t ∣ w 1 m , G ) P(t|w_{1m},G) P(tw1m?,G)

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

句法分析结果的评估

在这里插入图片描述
举例:
在这里插入图片描述
在这里插入图片描述

3. 已知一个句子,如何设定语法的规则概率,才能使该句子的概率最大? arg ? max ? G P ( w 1 m ∣ G ) \mathop{\arg\max}\limits_{G} P(w_{1m}|G) Gargmax?P(w1m?G)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

(五)PCFG的问题及解决方法

在这里插入图片描述

PCFG独立性假设的弱化

  • 人们在实际分析句子的时候利用了各种信息源,但PCFG的独立性假设认为这些因素都与句法分析树的概率无关。实际上,这些信息源对于消除分析树的歧义是有用的。
  • 要构造一个优于PCFG的统计句法分析器,至少需要借助于这些信息源中的一部分。

1. 方案一:词汇化

在这里插入图片描述
在这里插入图片描述

2. 方案二:结构化上下文的概率依存

在这里插入图片描述

(六)其他句法分析方法

1. 依存语法

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2. 其他句法分析方法

在这里插入图片描述

3. 一些可免费使用的句法分析器

在这里插入图片描述

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-10-29 13:03:21  更:2021-10-29 13:05:53 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 6:26:05-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码