一种基于数据的、可自适应扩展的时频卷积网络,用于长序列时间序列预测

时间:2025年11月18日
来源:IEEE Transactions on Knowledge and Data Engineering

编辑推荐:

STCNet通过熵自适应小波基选择和分层自适应因子平衡高低频信息提取,结合测试时训练优化输出,在九类数据集上优于现有模型。

广告
   X   

摘要:

基于Transformer变体的模型在长序列时间序列预测中始终表现出领先的性能。然而,在一些复杂的应用场景中,Transformer倾向于捕捉数据中的低频信息,而忽略了高频信息,而高频信息通常包含丰富的非平稳特征。这种不平衡的特征提取方法限制了模型有效处理真实世界时间序列数据的能力。为了解决这个问题,我们明确表示了低频和高频信息,并提出了一种名为STCNet的模型,这是一种数据驱动的、具有自适应尺度的卷积网络,旨在通过以平衡的方式学习不同频率带上的特征来提取数据中的多样化特征和模式。具体来说,我们提出了一种基于熵的自适应小波基选择算法,该算法可以根据数据分布自适应地选择适当的小波基,以实现复杂时间序列的有效多频率分解。此外,我们设计了一个分层自适应因子,通过精细的分层权重调整,允许根据不同的时间尺度动态调整特征权重,显著增强了模型处理非平稳时间序列特征的能力。为了进一步优化模型的输出特征,我们引入了一种测试时训练机制,结合了快速权重更新策略和权重共享策略来减少模型参数的数量,有效降低了过拟合的风险。在九个数据集上的实验结果表明,STCNet在有效性和效率方面都优于当前最先进的模型。

引言

长序列时间序列预测(LSTF)是数据挖掘中的一个关键领域,广泛应用于金融市场预测[1]、[2]、[3]、天气预测[4]、[5]、[6]、能源需求预测[7]、[8]、[9]、交通流量预测[10]、[11]、[12]以及医学诊断[13]、[14]、[15]等领域[16]、[17]、[18]。真实世界的时间序列数据主要来源于传感器捕获的信号,通常表现为随时间变化的不同频率的波信号的叠加。这导致数据中存在各种特征和模式,如长期趋势、短期波动和局部突变,这些特征和模式往往相互交织并影响彼此。因此,提取非平稳特征变得极具挑战性。为了理解真实世界场景中数据的行为和潜在属性,我们对来自四个不同领域的数据集进行了功率谱分析:ETTh2[1]、ILI[2]、Exchange[3]和Traffic[4]。

https://github.com/zhouhaoyi/ETDataset

https://gis.cdc.gov/grasp/fluview/fluportaldashboard.html

https://github.com/laiguo-kun/multivariate-time-series-data

http://pems.dot.ca.gov

生物通微信公众号
微信
新浪微博


生物通 版权所有