[人工智能] 机器学习-LSTM中的几个参数理解

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 机器学习-LSTM中的几个参数理解 -> 正文阅读

[人工智能]机器学习-LSTM中的几个参数理解

背景介绍

时间序列的处理使用RNN更为有效。但RNN中的一些参数理解起来与CNN差别很大，这篇文章主要梳理一下RNN中LSTM架构的几个关键参数以及如何理解这些参数。

以pytorch为例，我们首先看一下LSTM网络的构建过程

class RNN(nn.Module):
    def __init__(self):
        super(RNN, self).__init__()

        self.rnn = nn.LSTM(
            input_size=1,  
            hidden_size=64, 
            num_layers=1,  
            batch_first=True, 
        )
        self.out = nn.Linear(64, 2) 

    def forward(self, x):
        r_out, (h_n, h_c) = self.rnn(x, None) 
        out = self.out(h_n[0])
        return out

我们使用一个比较简单理解的例子来解释一下这几个主要参数的含义，比如我们用30天的买东西的数据来预测第31天的，每天采集一组数据，这组数据可以表示为

day1 : {面包：5个，泡面3个，火腿肠2个，卤蛋2个，可乐2个}

day2 : {面包：3个，泡面1个，火腿肠2个，卤蛋1个，可乐1个}

以此类推

这里我们可以看到，我们一共有30天的数据，每天的数据包含5个种类?。

input_size

特征的长度，在我们的例子中，就是每一天的数据中包含几个维度，这里就是5。如果是做自然语言处理，那embedding之后的size就是这个input_size。通常数据维度越多可能会使预测更准，但是会带来维度灾难的问题，维度达到某个程度以后，不但性能不一定会提升，还会打来巨大的计算消耗，这里需要使用者自己去权衡。