| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 论文笔记:N-BEATS: NEURAL BASIS EXPANSION ANALYSIS FORINTERPRETABLE TIME SERIES FORECASTING -> 正文阅读 |
|
[人工智能]论文笔记:N-BEATS: NEURAL BASIS EXPANSION ANALYSIS FORINTERPRETABLE TIME SERIES FORECASTING |
ICLR 2020 0 摘要? ? ? ? 本文重点研究了利用深度学习解决单变量时间序列点预测问题。 ????????我们提出了一种基于后向和前向残留链路和一个非常深的全连接层堆栈的深度神经结构。 ????????该体系结构具有许多令人满意的特性,这些特性是可解释的,适用于广泛的目标领域而无需修改,并且可以快速训练。 ????????我们在几个著名的数据集上测试了提出的体系结构,包括M3、M4和旅游竞赛数据集,这些数据集包含了来自不同领域的时间序列。 ????????我们展示了两个配置下N-BEATS模型 在所有数据集 中的最先进的性能:相比于统计基准,提高了预测准确性11%,相比于去年M4比赛的冠军,提升了3%。 ????????我们模型的第一个配置不使用任何特定于时间序列的组件,它在异构数据集上的表现强烈地表明,与普遍接受的智慧相反,深度学习原语(如残差块)本身就足以解决广泛的预测问题。 ? ????????最后,我们演示了如何将所提议的架构加以扩充,以提供可解释的输出,而不会造成大的准确性损失。 1 简介?? ? ? ? 时间序列预测问题,不像计算机视觉或自然语言处理等领域【在这两个领域,深度学习(DL)技术现在已经牢牢占据优势】,仍有证据表明,深度学习和DL相比于超越经典的统计方法,没有特别多的优势 (Statistical and machine learning forecasting methods: Concerns and ways forward) ? ? ? ? 本篇论文旨在探索纯deep learning架构在时间序列预测问题中的潜力。 ????????此外,在可解释DL架构设计的背景下,我们有兴趣回答以下问题:我们能否在模型中注入合适的归纳偏差,使其内部操作更易于解释(即提取一些可解释的驱动因素,结合产生一个给定的预测)? 1.1 本文贡献1.1.1 深度神经网络架构????????我们所知,这是第一篇论文用实验结论证明:没有使用时间序列特定组件、只依靠纯deep learning的模型,在 M3, M4和旅游数据集上的表现 优于广泛使用的统计方法。 ????????在我们看来,这为纯ML在时间序列预测中的应用提供了一个长期缺失的概念证明,并增强了继续推进该领域研究的动力。 1.1.2 时间序列问题中的可解释性深度学习????????除了准确性方面的好处外,我们还表明设计一个具有可解释输出的架构是可行的,从业者可以 以与传统分解技术(如“季节性-趋势-级别”方法)非常相同的方式使用该架构 2 问题定义????????考虑离散时间条件下的单变量点预测问题。 ????????给定一个长度为h的预测视界,一个长度为t的观测序列历史,我们的任务是预测未来 ? ? ? ? 出于简化考虑,我们将一个长度为t≤t,以最后一个观测值yT结束的回溯窗口作为模型输入 ? ? ? ? ?我们记为y的预测值 ? ? ? ? 下面的几个是用来衡量模型的预测效果的? RMSE、MAE等误差指标整理_UQI-LIUWJ的博客-CSDN博客 ? ? ` ????????这里m是数据的周期。 ????????MAPE (Mean Absolute Percentage Error), sMAPE (symmetric MAPE)和MASE (Mean Absolute scaling Error)是预测实践中的标准无标度度量。 ????????sMAPE是通过预测和真实之间的平均值来缩放误差。 ????????MASE根据na?ve预测器的平均误差进行缩放,该预测器简单地复制了过去测量的倒数第m个周期的观测结果,因此考虑了周期性。 ????????OWA(总体加权平均)是一个m4特定的指标,用于对参赛作品进行排名,其中sMAPE和MASE指标被标准化,因此经季节性调整的na?ve预测得到OWA = 1.0。 3 N-Beats????????我们的架构设计方法依赖于几个关键原则。
现在,我们将讨论这些原则如何与提议的体系结构结合起来 3.1 基本单元
????????这部分结构的一个任务是预测正向预测?(每一个dim 一个θ值),最终目标优化?前向预测?的准确性。 ????????此外,该子网络预测xl的最佳估计,其最终目标是通过移除输入数据中对于预测任务没有帮助的成分,来帮助下游模块更好地进行预测。? ? ?3.2?DOUBLY RESIDUAL STACKING?双重残差叠加
? ?????????如前所述,在第一个块的特殊情况下,它的输入是模型的全部输入x, x1≡x。 ????????对于所有其他块,backcast残差分支xl可以被认为是对输入信号进行序列分析。 ????????前一个基本模块去掉了信号中可以很好近似的部分,使得下游区块的预测工作更加容易。(残差链接的好处) ????????这种结构还促进了梯度反向传播。(残差链接的好处) ????????更重要的是,每个基本模块输出它本身可以预测的部分前向预测,这些前向预测提供了层级分解。 ????????最后的预测是所有部分预测的总和。 ????????当允许为每一个基本模块有自己的后向和前向时,这使得网络对梯度流更加透明。 ? ? ? ? 如果?后向和前向?共享一个基,此时通过聚合有意义的部分,对实现可解释性至关重要。(3.3将会涉及) 3.3 可解释性????????基于和'的选择,我们提出了两种架构配置。 ?????????其中一种是通用深度学习,另一种增加了某些归纳偏差以使其可解释。
?3.3.1 可解释性结构????????可解释的体系结构可以通过重用图1中的总体体系结构方法,以及在stack级别(图1中间的结构)向基层添加结构来构建。 ????????预测人员经常使用如X13-ARIMA模型等将时间序列分解成趋势和季节性。 ????????我们建议在模型中设计趋势和季节性分解,以使stack级输出更容易解释。 ????????注意,对于通用模型来说,栈的概念是不必要的,并且为了清晰起见省略了栈级索引。 ????????现在我们将同时考虑堆栈级和块级索引。例如,表示栈s中块l的局部预测'。 3.3.2 趋势模型????????趋势的一个典型特征是,大多数时候它是一个单调的或者至少是一个缓慢变化的函数。 ????????为了模拟这种行为,我们建议将和约束为一个p的多项式(p是一个小的degree值),一个在预测窗口中缓慢变化的函数: ???????? ? ? ? ? 其中向量t为(H是预测窗口的长度) ? ? ? ? 换句话说,我们只是把基本模块里面的?替换成了 ? ? ? ? ? ????????用矩阵的形式表示,有: ? ? ? ? ?其中就是第s个stack,第l层的前向传播系数 ???????? ?3.3.3?周期性模型? ? ? ? 周期性的典型特征是它是一个有规律的,循环的,反复出现的波动。 ????????为了模拟周期性,我们限制和属于一类周期函数,即其中?是周期。 ????????建立周期函数模型的基础自然选择是傅里叶级数: ? ????????? ? ? ? ? 用矩阵形式表述,有: ? ? ? ? ? ?是正弦波矩阵 ?3.3.4 整体可解释结构?????????整个可解释架构由两个stack组成:趋势stack,周期性stack。 ????????双重残差叠加结合预测/倒推原理可以使得 (i)趋势成分在x被输入到周期性stack之前被移除了【个人猜测是因为相同基的系数互相抵消】 (ii)趋势和周期性的预测作为单独的可解释输出。 ????????从结构上讲,每个栈由图1所示的用残余连接连接的几个块组成,每个块共享其各自的、不可学习的?和?。 ????????趋势和季节性的区块数都是3。 ????????我们发现,在共享??和?的基础上,在堆栈中跨块共享所有权重可以获得更好的验证性能。 *********集成学习部分暂时略去,后补********** 5 实验部分论文中说的两个配置被记为:generic (N-BEATS-G) ;interpretable (N-BEATS-I)
我们的结论是,DL模型的输出可以通过在体系结构中编码一个合理的归纳偏差来实现。表1确认了这不会导致性能下降。 ******** 后注:可以想象成,我输入一个单变量时间序列,经过基本块后,得到前向传播(y)以及backcast的x 这两个的基的系数。然后将基加权求和。(两个配置里面,一个的基是可学习的,另一个的基是指定的【解释性配置】) |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/11 0:26:20- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |