重新思考长期预测中的多元建模:一种结合幂分解和事后校准的高效单变量框架

时间:2026年2月14日
来源:Neural Networks

编辑推荐:

长期时间序列预测中,多变量模型面临异步数据漂移、噪声干扰和突发变化等问题,本文提出单变量模型PDCNet。通过功率分解(P3D)分离数据主导周期性,并采用基于历史性能的轻量级在线后校准机制,有效抑制非平稳性影响。实验表明,PDCNet在68.57%的案例中提升15%预测精度,后校准再增16%准确率,且显存占用减少95%,在单变量和多变量任务中均表现优异。

广告
   X   

陈洪池|唐吉飞|夏兰华|鲍元金
中国浙江省杭州市杭州电子科技大学通信工程学院,邮编310018

摘要

长期时间序列预测(LTSF)在工业应用中至关重要。尽管最近的研究主要集中在建模复杂的多变量相互作用上,但由于异步数据漂移、噪声干扰和突变等挑战,实际收益可能非常有限。本研究证明了设计良好的单变量模型可以更有效和高效。本文提出了基于幂分解和在线后校准(PDCNet)的单变量模型,该模型结合了两种新颖机制:1)幂分解(P3D)根据数据功率分布来解耦时间序列,显著提高了数据预测能力并减轻了主导周期性的干扰;2)通过设计突变因子M来分类数据形态变化,并利用基于历史性能的校正字典进行轻量级在线后校准,以适应模式漂移而无需重新训练主模型。综合实验表明,PDCNet在单变量任务上始终优于现有最先进模型。通过简单聚合,它在68.57%的情况下实现了顶级多变量性能。在标定区域,校准进一步将准确率提高了16%。值得注意的是,与多变量模型相比,PDCNet在极端规模任务中可将GPU内存使用量减少高达95%。我们的工作证明了捕捉每个变量内的内部时间依赖性是LTSF的一种更高效和实用的设计方法。PDCNet可以作为有竞争力的基线模型,提供卓越的性能并显著降低内存占用。相关源代码和配置文件可访问于:https://github.com/hongchichen/PDCNet

引言

时间序列预测(TSF),尤其是长期时间序列预测(LTSF),是许多工业应用的基本要求,广泛应用于能源(Lai等人,2018年)、金融(Rossi,2013年)和医疗保健服务(美国疾病控制与预防中心,2025年)等领域。深度模型的发展得益于其强大的非线性逼近能力,显著提升了LTSF任务的性能。许多创新结构已被提出,其预测能力远超传统数学建模(Wu等人,2023年)。
为了捕捉多变量之间的更全面交互特征以提高LTSF性能,人们设计了复杂的架构。这些成功的案例持续激发了后续模型的发展。然而,尽管多变量建模很有吸引力,但它对以下因素很敏感:
  • 误差传播:多变量模型学习函数
    f:RN×TRN×H
  • 异步偏移:由于外部独立因素的影响,现实世界系统中的变量往往异步漂移。多变量模型学习联合分布P(Y|X)。任何一个变量的偏移都会使这种联合分布变得不理想,从而降低所有变量的预测性能。表1量化了异步漂移对多变量建模的影响。在ETTh1数据集的不同变量中手动注入了15、30和45步的时间延迟,以模拟现实场景中的异步采集或传输延迟。随着不对齐程度的增加,性能显著下降,这表明模型对变量间同步性非常敏感,尽管其影响可能取决于延迟序列与潜在周期性的具体相位关系。
  • 突变放大:单个变量Xi的突变δ会通过跨变量权重Wij传播到其他预测结果。对于线性多变量模型,yj^(t)=i1Wif(xi(t+εi(t
  • 由于这些因素,多变量模型的性能可能会受到限制,而且计算资源消耗较大。
  • 如图1所示,尽管单变量建模也存在类似挑战,但通过隔离变量,单变量方法自然避免了这些问题。单变量建模中,每个时间序列被独立处理,形成独立的映射fi:RTRH

    深度模型在LTSF中的发展

    深度学习的发展为LTSF提供了新的架构,提供了传统统计模型(如ARMA/ARIMA,Tarmanini等人,2023年)的替代方案。基于卷积结构的模型(如TimesNet,Wu等人,2023年;MICN,Wang等人,2023年;ModernT,Donghao和Xue,2024年)利用CNN进行高效的特征提取。受到Transformer(Vaswani等人,2017年)成功的启发,还出现了类似Informer(Zhou等人,2021年;Fedformer,Zhou等人,2022年)的变体。
    如图3所示,PDCNet结合了幂分解(P3D)和在线后校准技术,旨在应对数据突变对LTSF的影响。PDCNet由多个D×D卷积块(D² CONV)堆叠组成,通过堆叠处理获得粗略预测结果,然后通过基于校正字典的设计进行后校准来修正这些结果。
    实验结果
    对提出的PDCNet在各种时间序列预测基准测试中进行了全面评估。其整体性能总结在图9中。此外,还详细比较和分析了其组成模块的有效性、泛化能力以及消融研究的结果。所有实验内容列在表2中。
    数据集 我们的实验广泛使用了9个真实世界数据集,包括ETTh1、ETTh2、ETTm1等。
    讨论
    为了提高性能,当前大多数LTSF模型采用复杂架构来捕捉变量间的交互作用。然而,我们的实验结果表明,由于异步分布漂移、幅度突变和数据不对齐(这些因素可能引入噪声和不稳定性的影响),复杂多变量方法的实际收益往往有限。单变量建模自然避免了这些问题。
    结论
    在本文中,我们提出了一个以单变量为中心的深度学习框架PDCNet,该框架专注于学习序列内的时间依赖性,证明了其在LTSF方面的潜力。与流行的多变量建模趋势相反,一个设计良好的单变量模型,通过特殊设计来处理突变和模式漂移等内部异常,可以实现有竞争力的甚至更好的性能。综合实验验证了PDCNet的优势。
    CRediT作者贡献声明
    陈洪池:验证、软件开发、数据分析、形式化分析、数据整理。唐吉飞:撰写初稿、方法论设计、研究调查、资金获取、概念化。夏兰华:撰写与编辑、监督、资源管理、项目协调、方法论设计、资金获取。鲍元金:可视化处理、验证、形式化分析。
    利益冲突声明
    作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。
    致谢
    本工作部分得到了中国国家自然科学基金项目(项目编号62371177和62004054)以及浙江省自然科学基金项目(项目编号LY23F010010)的支持。

    生物通微信公众号
    微信
    新浪微博


    生物通 版权所有