时间序列预测是一种通过分析历史数据中的动态模式来预测未来趋势的重要技术(Wu等人,2023a)。它在各个领域都有广泛的应用,包括天气预测(Wu, Zhou, Long, & Wang,2023b)、交通管理(Chen, Petty, Skabardonis, Varaiya, & Jia,2001;Yin等人,2021)、经济分析(Granger & Newbold,2014)以及能源规划(Martín等人,2010;Qian, Pei, Zareipour, & Chen,2019)。为了应对时间序列预测的固有复杂性,研究人员开发了各种预测模型,如经典统计方法、机器学习方法和早期深度学习框架。尽管这些方法在短期预测方面取得了显著的成功,但它们的性能仍然不足以满足现实世界场景中更广泛的长期预测应用(Wang, Zheng, Liu, & Chen,2024b)。因此,提高长期时间序列预测的准确性仍然是一个紧迫的研究挑战。
随着数据量的快速增长和技术的不断进步,现实世界的时间序列往往表现出层次化的语义结构,包括随时间和上下文变化的瞬态波动、周期性模式和演变趋势。如图1所示,不同的时间序列通常显示出独特的周期性波动模式,需要在不同时间尺度上进行建模以准确捕捉其独特的周期性行为和动态变化。然而,现有方法主要依赖于固定的时间尺度建模策略,在处理复杂的多尺度数据时面临显著的限制。一方面,这些静态方法难以有效捕捉不同尺度上的关键特征,特别是在长期预测中,它们无法处理多种波动模式和趋势之间的复杂相互作用,可能会引入冗余信息并降低预测准确性。另一方面,许多现有方法缺乏动态适应机制,这对于根据时间序列数据的多样性和复杂性调整建模策略至关重要(Chen等人,2024)。如果没有这样的机制,模型在多尺度场景中会遇到困难,并且无法有效地泛化到新的或不断演变的数据集(Li, Xu, Wang, Jiang, & Liu,2019)。尽管手动调整建模尺度可以在一定程度上解决这些问题,但它们既耗时又不足以处理未知或动态变化的数据分布。
时间序列预测不仅涉及解决多尺度建模的挑战,还需要平衡局部特征和全局特征的建模。局部特征捕捉细粒度的动态变化,如短期波动和局部扰动,而全局特征强调总体趋势和长期依赖性。深度学习模型最近在这个领域取得了显著进展,因为它们能够捕捉这种复杂的动态。卷积神经网络(CNN)因其通过分层感受野提取局部特征的有效性而被广泛采用(Chen, Guan, Du, & Ayush,2025;Su等人,2024;Wang, Liu, Du, Dong, & Yang,2023b)。然而,它们有限的感受范围使得它们不适合长距离建模。循环神经网络(RNN)及其变体被引入以解决序列依赖性问题,但它们经常遭受梯度消失的问题,并且对于长序列的可扩展性有限(Cooley & Tukey,1965;Jia等人,2024;Zhu, Liu, Chen, Liu, & Tao,2024)。最近,基于多层感知器(MLP)的方法因其简单性和并行性而被探索,但它们固定的感受野仍然限制了它们捕捉复杂时间层次结构的能力,特别是在长期预测中(Ailing, Chen, Zhang, & Xu,2023;Wang等人,2024b)。Transformer架构凭借其自注意力机制在建模全局依赖性方面表现出色,并已被广泛应用于时间序列任务(Liu等人,2024b;Wang, Long, Zheng, & Shang,2024c;Zhu等人,2024)。尽管在捕捉长期模式方面有效,但由于缺乏强烈的局部性先验,Transformer在建模局部结构和短期波动方面往往表现不佳。此外,它们固定的层结构和均匀的注意力分布往往无法适应现实世界时间数据的多样化多尺度特性。
为了解决单个架构的局限性,一些最近的研究探索了混合预测模型,这些模型将不同类型的神经网络组件(如CNN、RNN、MLP和基于注意力的机制)集成到统一的框架中(Naghashi, Boukadoum, & Diallo,2025;Ye等人,2025)。虽然这些努力表明了对架构整合的兴趣日益增长,但许多现有方法仍然采用模块化或堆叠式设计,其中组件独立运行,没有动态交互或跨层次协调。因此,这样的模型往往无法适应性地捕捉多个分辨率下的时间依赖性,并且难以泛化到复杂或异构的时间序列模式。这些局限性突显了需要一个统一且具有交互意识的预测框架,该框架能够有效地桥接局部-全局表示并动态适应不同的时间结构。
为了解决这些挑战,我们提出了MatNet,这是一个多尺度时间序列预测网络,它通过双向协作路径和动态时间感知路由机制统一了局部和全局特征建模。MatNet不是静态地组合CNN和Transformer模块,而是引入了一个渐进式的交互过程,支持在多个阶段递归细化时间特征。该网络通过分阶段的特征交互机制将细粒度的局部特征与全局宏观级表示无缝集成。网络包含三个关键组件。首先,动态时间感知路由器利用时间序列的趋势和周期性特征来动态分配建模尺度,并根据频域和时域分解调整特征权重,从而实现精确的关键特征提取,同时提高模型的灵活性和鲁棒性。其次,多尺度特征增强模块采用多感受野建模策略,从局部和全局角度放大特征表示,提供更丰富和更全面的多尺度表示。最后,三阶段基于注意力的多尺度融合机制逐步对齐和整合层内、层间和跨尺度特征,支持动态语义融合。
总体而言,这些组件构成了CNN和Transformer分支之间的双向协作框架,实现了结构和时间层次上的动态信息流动和相互增强。这种设计促进了细粒度局部细节与全局上下文依赖性的有效整合,从而增强了语义一致性并提高了整体预测性能。通过解决这些关键挑战,本文提出了一个统一的协作框架,推动了时间序列预测领域的最新进展。
主要贡献总结如下:
•我们提出了一个具有双向协作路径的多尺度时间序列预测架构。它有效地利用了Transformer的长距离依赖性建模能力,同时结合了多感受野金字塔卷积特征,使模型具备了实现更全面的多尺度时间建模的能力。
•我们提出了一个具有三阶段注意力机制的多尺度融合模块,该模块能够在局部和全局特征之间实现分阶段的双向指导,促进动态特征对齐,同时保持语义表示的完整性和一致性。
•我们提出了一种动态感知策略来处理复杂的动态模式,该策略可以自适应地调整建模尺度和权重,实现最佳尺度选择和有效的特征提取。
•广泛的实验结果表明,MatNet显著提高了长期时间序列预测的性能,有效解决了现有方法的局限性,并能够有效适应复杂的动态场景。