IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> NLP-D27-梯度剪裁-LSTM-GRU-毕业答辩ppt -> 正文阅读

[人工智能]NLP-D27-梯度剪裁-LSTM-GRU-毕业答辩ppt

—0436标题为nlp,但是到现在还没看宝可梦!不过感觉越来越近了!今天虽然是周六,不过还是4点就起了,最近这个时间的学习效率越来越高,不是在自我感动,要努力,要出活。

—0507写了近期计划,可以开始继续coding了!!!昨天晚上看完了rnn,还没动手实现呢!

1、one_hot(,)

独热编码的种类数(第二个参数)不能少于实际值(第一个参数)种类的数量,不然会报错。

2、len(new_state)和和new_state的维度

为了和后面的lstm兼容,把new_state写成了一个tuple。在rnn中,这个tuple只有一个,是两维的。大小是[batch_size,num_hiddens]
在这里插入图片描述

0553干饭干饭干饭!!!

–0629吃饭的时候看完了沐沐的Q&A,还找了半天蛋白杯哈哈哈!继续码代码了!

3、梯度剪裁

梯度剪裁通过限制梯度范数的大小,避免其过大,造成梯度爆炸。

4、torch.cat的用法

cat是将多个张量拼接,不是将一个张量转换维度(reshape)

5、rnnepoch和iter和batch的关系

一个iter就是一个epoch。
一个iter可以yield几个batch。
每个batch中包含batch_size个seqs。
每个seqs有num_seqs个时间步,做num_seqs次预测。

6、super()用法

其实就是调用父类的init,相当于是继承父类的属性和函数,如果里面有**kwargs相当于是给父类传参。
在这里插入图片描述

参考:https://zhuanlan.zhihu.com/p/260533951

7、nn.RNN(,)的输出是隐藏层,而不是最后的y

在这里插入图片描述

8、框架优化主要体现在

(1)loss
(2)updater
(3)layers
A. nn.RNN(len(vocab, num_hiddens)
B.nn.Linear(,)

GRU

1、gru主要是两个门:重置门和更新门;这两个门都是通过学习产生的,与xt和ht-1有关。
2、重置门可以决定ht-tilta要多要Xt;更新门可以决定保留多少ht-1。最终可以达到只要xt或者只看ht-1的效果
3、由2,总的来说,重置门可以决定短期记忆;而更新门可以决定长期记忆。

-----1030GRU的手撕还要再写几遍,不熟悉,多理解一下,先去吃饭。
在这里插入图片描述

—1406复习一下GRU的门控结构。
不要忘记加激活函数哇~
在这里插入图片描述

LSTM

这一块书上比沐神讲的清楚哈哈
在这里插入图片描述
1、另一种更新隐状态h的机制——通过Memory cell来更新
2、遗忘门负责决定忘掉多少ct-1;输入门决定输入多少ct_tilta(用tanh);输出门则决定将多少Ct输出给H。
甚至感觉比GRU清晰。
GRU总结:
1、两个门:Reset和Update。
Reset用于计算H_tilda,决定留下多少之前的H;Update用于计算H,决定留下多少X

我感觉我说的很对,但是好像和小结里说反了。。

–1508写完lstm啦,没做答辩ppt总觉得慌慌的。要不先做一下叭唉唉哎

----5月22号0527补------------呜呜呜,吃完饭去做ppt了,一下子做到了半夜,没有刷题和看翻译,不过好的是今天可以把沐神的课看完啦!!!1

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-05-26 15:18:31  更:2022-05-26 15:18:40 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 4:27:16-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码