| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> GRU(门控循环单元),易懂。 -> 正文阅读 |
|
[人工智能]GRU(门控循环单元),易懂。 |
一、什么是GRU? GRU(Gate Recurrent Unit)是循环神经网络(RNN)的一种,可以解决RNN中不能长期记忆和反向传播中的梯度等问题,与LSTM的作用类似,不过比LSTM简单,容易进行训练。 二、GRU详解 GRU模型中有两个门,重置门和更新门,具体作用后面展开说。 先来看一张GRU的图,看不懂没关系,后面慢慢展开说。 符号说明:
tanh: tanh函数,通过这个函数可以将数据变为[-1,1]范围的数值 先不看内部具体的复杂关系,将上图简化为下图: ?结合 的推导是GRU的关键所在,我们看一下GRU所用到的公式: 这四个公式互有关联,并不是单独去使用,下面我们详细展开。 1. 重置门 ?重置门决定了如何将新的输入信息与前面的记忆相结合,这句话猛的一看也不好理解,我们再继续拆解。 ? ?将这个图片转化为公式就是重置门的公式: 这里 用这个权重矩阵对 ?为了方便理解,我们将这个公式展开: 下面便是重点:
说明上一时刻需要遗忘的越多,丢弃的越多。
当 当 这就是重置门的作用,有助于捕捉时间序列里短期的依赖关系。 2.更新门 ?更新门用于控制前一时刻的状态信息被带入到当前状态中的程度,也就是更新门帮助模型决定到底要将多少过去的信息传递到未来,简单来说就是用于更新记忆。结合下面两个公式比较好理解: 更新门公式: ? 更新记忆表达式: ? ?
综上, ? 门控循环单元GRU不会随时间而清除以前的信息,它会保留相关的信息并传递到下一个单元。 参考资料: |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年2日历 | -2025/2/21 3:29:30- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |