[人工智能] RNN浅谈

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> RNN浅谈 -> 正文阅读

[人工智能]RNN浅谈

RNN

文章目录

- - RNN

参考

RNN 解决了什么问题

即应用场景，RNN在处理有时序关系的输入的时候比一般的神经网络更具有优势，原因是一个句子中的前后往往是相联系的，而一般的神经网络只是将句子里的每个词分开来考虑，这样的话对句子这种有时序关系的输入是很不利的，而RNN就考虑了当前词的前面的信息，相对会好很多。
例子就参考一文搞懂RNN（循环神经网络）基础篇这篇的词性标注的例子

RNN的结构

相对FC，RNN多了一层支线——隐藏层的输出s会被权重矩阵 w保存下来，用于下一时刻和新的input一起输入，即上图中右侧公式a所示，本时刻输出的话就加一层softmax（这个可以自行根据任务选择）即可
我们将RNN按照时间序列展开就是这样

RNN的特点

串联结构，体现“前因后果”，即后面结果的生成需要参考前面的信息
所有特征共享参数：
- 减少参数量
- Seq2Seq
- 词不同和词序不同都能学对相应的不同的结果

RNN的损失函数

单个时间步的损失函数
这个可以根据不同任务而自定义
整个序列的损失函数
- 就是整个序列的时间步的损失求和

RNN的反向传播

我重新画了一下图公式还是上面的公式:
$a^{<t>}=W_{ax}x^{<t>}+W_{aa}a^{<t-1>}+b_a\\ y^{<t>}=softmax(W_{ya}a^{<t>}+b_y)$

然后参照吴恩达老师的课（[双语字幕]吴恩达深度学习deeplearning.ai），把它按照时间序列展开：

- 由于参数是共享的，于是这里化简一下图之后画出BP路线，名为通过时间的反向传播（loss用的交叉熵，不过这不重要） - ![在这里插入图片描述](https://img-blog.csdnimg.cn/0b7717821550463a80af58c70a834363.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA5qSw5a2Q5aW257OW,size_20,color_FFFFFF,t_70,g_se,x_16)