| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 循环神经网络(二)——LSTM -> 正文阅读 |
|
[人工智能]循环神经网络(二)——LSTM |
1. 为什么需要LSTM普通RNN的信息不能长久传播(存在于理论上)。 ,输入x会稀释掉状态s,故其信息不能长久的传播。 2. LSTM中引入了什么2.1 选择性机制
2.2.2 门限机制向量A——>sigmoid ——>[0.1, 0.9, 0.4, 0, 0.6] 向量B——>[13.8, 14, -7, -4, 30.0] A为门限,B为信息 A * B = [0.138, 12.6, -2.8, 0, 18.0](通过门限,对B的信息做一些选择,可以把值的大小,当作包含信息的大小) 3 LSTM模型结构三个门:遗忘门,传入门,输出门 两个状态:Ct,ht 3.1 cell的状态传递3.2 遗忘门?ft决定ct-1中哪些东西需要被遗忘。 eg:新的一句有新的主语,就应该把之前的主语忘掉 3.3 传入门? Ct波浪,表示从输入中得到的信息;it是门限,控制有多少信息可以保存下来。 eg:是不是要把主语的性别信息添加进来 3.4 输出门Ct的哪些信息可以输出出来。 eg:比如下一个词是动词,除了预测这个动词之外,还要加其是单数或者是负数的信息(动词该用单数还是复数?) 3.5 当前状态经过遗忘门的上一状态; 经过传入门的输入状态 4.实战4.1 文本分类该文本分类把如下代码中的SimpleRNN 改为LSTM即可2.4.1文本分类https://blog.csdn.net/zhao_crystal/article/details/123319419?spm=1001.2014.3001.5501#t23 4.2 文本生成该文本分类把如下代码中的SimpleRNN 改为LSTM 2.4.2文本生成https://blog.csdn.net/zhao_crystal/article/details/123319419?spm=1001.2014.3001.5501#t24需做如下调整 4.2.1 需要调节LSTM接口的两个参数stateful:Boolean (default? recurrent_initializer:Initializer for the?
4.2.2 使logistic更greedy令predictions乘以某个小于1的数temperature,使得predictions分布更集中,数据更greedy。? ? ?temperature > 1, predictions的分布更均匀,即数据更随机,random
? ? ? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/9 1:55:44- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |