前言
提示:仅表示自己对于文章的理解,欢迎批评与交流:
近期正在学习时空预测的相关知识,写博客也是为了敦促自己学习,由于是小白,很多问题都不清楚,期待大家的交流,有错误的地方希望可以指正,谢谢!
论文名称:Occurrence prediction of cotton pests and diseases by bidirectional long short-term memory networks with climate and atmosphere circulation
论文地址 下面是我读完paper的笔记
‘’’ 论文设计了一种改进的Bi-LSTM网络,利用气候因子和大气环流参数形成分类模型。 ‘’’
1.数据
1、气候因子的组合:LTP, TF, PTR, THC. 2、循环参数的选择 使用基于随机森林的嵌入方法,选择了25个重要的循环特征,并将这25个特征与气候因子像融合,来预测棉花病虫害。
3、根据病虫害的发生程度,分为:无病虫害,轻微(<5%),一般(5~20%),严重(>20%)
4、将预测问题转化为是否有特征向量x的问题
2、网络结构
1、使用Bi-LSTM网络结构,它是由两个并行的LSTM单元组成的,分别对应输入序列和输入序列的反方向,在每个时间步,将前向隐藏状态和反向隐藏状态进行拼接,这样可以同时捕捉到过去和未来的信息。输出公式表示为: 2、 (1)(X, Y)假设为输入数据,其中X:38个特征值是指12个气候因子和25个循环参数,一个表示的是棉花病虫害历史值;Y表示病虫害的危害程度。 (2)对特征向量进行特征选择和特征组合,选择合适的特征预测病虫害水平 (3)为了使不同的病虫害之间可以进行比较,使用归一化和标准化 (4)将病虫害时间序列预测问题重构为监督学习问题,转换之后的格式为(样本数量,时间步长,样本特征) (5)输入到Bi-LSTM网络中,引入“Dropout”避免过拟合
3、结果
paper中的试验: 1、分别根据指标AUC, ACC,F1-score, AP选择合适的Bi-LSTM的层数,全连接的层数以及全连接的单元数 2、分别于其他经典的机器学习方法进行比较,如KNN,随机森林和LSTM网络 3、相较于传统的神经网络,Bi-LSTM网络在处理小样本方面具有优势
|