IT数码购物网址头条软件日历阅读图书馆

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

图片批量下载器
↓批量下载图片,美女图库↓

图片自动播放器
↓图片自动播放器↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> RNN/LSTM及其变种 -> 正文阅读

[人工智能]RNN/LSTM及其变种

RNN/LSTM

1.RNN与mRNN
2.LSTM与mLSTM
参考文献

1.RNN与mRNN

mRNN(Multiplicative Recurrent Neural Network)原论文见参考1，其改进在于：

introduce a new RNN variant that uses multiplicative (or “gated”) connections which allow the current input character to determine the transition matrix from one hidden state vector to the next

二者结构的差异如下：
在这里插入图片描述

2.LSTM与mLSTM

mLSTM原论文见参考3。

相对于传统LSTM，其主要改进在于：

This mLSTM architecture was motivated by its ability to have both controlled and flexible input-dependent transitions, to allow for fast changes to the distributed hidden representation without erasing information.

在这里插入图片描述

代码实现见参考4,5。tf主要内容如下：

def call(self, inputs, state):
    m = tf.matmul(inputs, wmx) * tf.matmul(h_prev, wmh)
    z = tf.matmul(inputs, wx) + tf.matmul(m, wh) + b
    i, f, o, u = tf.split(z, 4, 1)
    i = tf.nn.sigmoid(i)
    f = tf.nn.sigmoid(f)
    o = tf.nn.sigmoid(o)
    u = tf.tanh(u)
    c = f * c_prev + i * u
    h = o * tf.tanh(c)
    return h, (c, h)

二者之间的关系与RNN/mRNN基本一致。可谓短小强悍！

未完待续

参考文献

[1] Multiplicative RNN
[2] Written Memories: Understanding, Deriving and Extending the LSTM
[3] MULTIPLICATIVE LSTM FOR SEQUENCE MODELLING
[4] mLSMT tf实现
[5] mLSMT jax实现

阅读世界，共赴山海

423全民读书节，邀你共读

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

上一篇文章下一篇文章查看所有文章

加:2022-04-22 18:36:57 更:2022-04-22 18:39:50

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

360图书馆购物三丰科技阅读网日历万年历 2025年7日历

-2025/7/19 8:30:53-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码