IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 自然网络语言模型(NNLM) -> 正文阅读

[人工智能]自然网络语言模型(NNLM)

在一语料库中, 假设有长度为 T 的文本序列 S : = w 1 , w 2 , ? ? , w T S:=w_{1},w_{2}, \cdots, w_{T} S:=w1?w2?,?,wT?. 如果选子序列 S : = w t ? 1 , w t ? 2 , ? ? , w t ? n + 1 S:=w_{t-1},w_{t-2}, \cdots, w_{t-n+1} S:=wt?1?wt?2?,?,wt?n+1?, 想预估 词汇 w t w_t wt? 出现的概率, 即计算条件概率
P ( w t ∣ w t ? 1 , w t ? 2 , ? ? , w t ? n + 1 ) . P(w_t| w_{t-1},w_{t-2}, \cdots, w_{t-n+1}). P(wt?wt?1?wt?2?,?,wt?n+1?).
可以使用 NNLM 的方法, 其工作流程见下图在这里插入图片描述
我们先假定语料库生成的 词汇共有 v 个, 则 每个词汇的 1-hot 为 v-维行向量.
第一步, 将 词向量 w i w_i wi?, i = t ? 1 , ? ? , t ? n + 1 i=t-1,\cdots,t-n+1 i=t?1,?,t?n+1, 投放到 d-维向量空间, d由个人选定. 此处使用的是 v × d v \times d v×d 矩阵C. 输出为 w i C w_i C wi?C, 将 n-1 个输出按顺序拼接成 ( n ? 1 ) d (n-1)d (n?1)d-维 行向量 x.

第二步, 将 x 输入到 tanh层中, 这是一个隐含层, 神经元个数可以自己选定设为 h. 于是有一 h × ( n ? 1 ) d h \times (n-1)d h×(n?1)d 的转移 矩阵, 设为 H. 这个层的输出为 h-维 向量 y’=tanh(xH+ b’).

第三步, 将 x , y ′ x,y' x,y 输入sigmoid 层, 输出为 一个行向量 y_t, 输出的维度是 v. 这里 两个转移矩阵 W ( n ? 1 ) d × v W_{(n-1)d \times v} W(n?1)d×v?, U h × v U_{h \times v} Uh×v?.
y t = s i g m o i d ( b + x W + y ′ U ) . y_t=sigmoid(b +xW + y'U). yt?=sigmoid(b+xW+yU).

使用最大似然估计计算 参数的值.
假定 w t w_t wt? 的索引是 i t i_t it?, 令 y t ( i t ) y_t(i_t) yt?(it?) 表示 y t y_t yt? 的第 i t i_t it?个分量, 也即预测为 w t w_t wt? 的概率. 希望 ∏ t = 1 T y t ( i t ) \prod_{t=1}^T y_t(i_t) t=1T?yt?(it?) 取最大值,
使用 log 后, 取均值, 变成希望
L ( H , b ′ , W , b , C ) : = 1 T ∑ l o g ? y t ( i t ) L(H,b',W,b,C):=\frac{1}{T} \sum log \, y_t(i_t) L(H,b,W,b,C):=T1?logyt?(it?)

取最值.

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-12-18 15:58:47  更:2021-12-18 15:58:58 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 0:21:31-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码