随着工业物联网[1]、智能电网[3]和金融风险管理[4]等领域的快速数字化转型,多变量时间序列数据的量正在呈爆炸性增长[5][6]。隐藏在这些数据中的异常事件(如设备故障、网络攻击和系统崩溃)通常具有很强的隐蔽性和突发性,对安全、经济稳定和社会治理构成重大威胁[7]。时间序列异常检测技术通过自动识别偏离正常模式的观测值,为系统健康管理、风险预警和决策提供关键支持[8][9][10]。然而,多变量时间序列异常检测面临几个挑战。首先,多变量耦合导致变量之间的复杂非线性依赖性,使得传统单变量方法难以捕捉跨维度的共现异常[11][12]。其次,时间动态性要求模型同时捕捉短期波动(如传感器漂移)和长期趋势(如设备退化)[13][14]。第三,计算效率瓶颈限制了模型在实时工业监控场景中的应用[15],因为现有的深度学习方法通常面临高计算复杂性和存储开销[16][17]。
传统的异常检测方法主要依赖于统计和基于规则的模型[18][19]。然而,随着数据维度的增加和数据结构的复杂性提高,这些方法的鲁棒性和适应性往往较差[20]。
近年来,深度学习方法为时间序列异常检测提供了新的方法。特别是循环神经网络(RNN)[21]和长短期记忆(LSTM)[22]网络,凭借其强大的时间序列建模能力,可以捕捉时间序列中的长期依赖性[23]。然而,这些方法仍存在某些缺点[10],尤其是在建模长时间序列和消耗计算资源方面。例如,LSTM-NDT[24]采用非参数动态阈值方法进行异常检测。尽管它能有效捕捉长期依赖性,但其计算复杂性高且难以并行化,这限制了其在实时检测中的应用。
此外,卷积神经网络(CNN)[25]也被引入用于处理时间序列数据。它们能有效提取局部特征并处理短期依赖性,但在建模长期依赖性方面表现有限。最近的研究(如ModernTCN[26])提出了深度可分离卷积等改进措施来优化计算效率。然而,这种方法仍然难以充分建模多变量依赖性,也无法完全区分局部和全局时间模式。DTAAD[27]通过结合TCN和Transformer增强了模型对局部和全局模式的建模能力,但在计算效率、模型可扩展性和多变量交互的深度建模方面仍存在某些限制。
尽管基于自注意力机制的图神经网络(GNN)[28]和Transformer模型[29]可以捕捉全局依赖性,但它们通常面临计算复杂性高和训练困难的问题[30],这限制了它们在实时异常检测任务中的应用[31]。例如,TranAD[32]结合了自注意力机制进行异常检测,在处理复杂数据时表现良好。然而,其计算复杂性和对噪声干扰的敏感性在实际应用中仍然是一个突出问题。相比之下,MAD-TCN基于纯卷积网络架构,通过解耦设计和自适应跨变量依赖性建模有效降低了计算复杂性,同时在处理长时间序列时仍保持高准确性和速度。
为了解决上述问题,本研究提出了一种新的多尺度自适应依赖性时间卷积网络(MAD-TCN)用于时间序列异常检测。该模型引入深度可分离卷积以降低计算复杂性,同时增强模型建模依赖性的能力。此外,还引入了膨胀卷积来克服传统卷积网络在建模长期依赖性方面的局限性。为了实现多变量依赖性的轻量级建模,我们设计了一个自适应跨变量依赖单元(CVA)。
与ModernTCN等最近的TCN变体相比,我们的MAD-TCN在三个方面优化了多变量时间序列异常检测。首先,ModernTCN专注于重新设计单分支TCN模块,通过DWConv和ConvFFN分离时间和特征混合,用于一般预测和分类任务。相比之下,MAD-TCN采用双分支时间架构,结合并行膨胀卷积,一个分支专注于短期局部模式,另一个分支捕捉长期全局上下文。其次,MAD-TCN不仅分离时间和特征维度,还明确引入了自适应跨变量特征融合模块(ACVF)来建模沿变量维度的复杂传感器间依赖性。第三,MAD-TCN的整体设计源于异常检测的特点:异常通常在全局趋势中表现出局部偏差。双分支架构结合CVA使模型对这些特定异常模式更加敏感。在图1中,我们展示了MAD-TCN在轻量级、效率和准确性方面的出色表现。
本研究的主要贡献如下:
1.我们提出了一种基于双分支深度可分离膨胀卷积的多变量时间序列异常检测模型(MAD-TCN)。该模型通过并行膨胀卷积分支在不同时间尺度上捕捉依赖性,有效提高了多变量时间序列异常检测的精度。
2.我们提出了一种解耦设计,包括一个与变量无关的多尺度特征提取模块(VIMS)和一个自适应跨变量融合单元(ACVF),其中包含一个跨变量自适应门(CVA)。该设计分别沿三个维度对时间序列数据进行建模:特征维度、变量维度和跨变量依赖性。具体来说,ConvFNN1和ConvFNN2处理特征和变量维度建模,而CVA模块动态调整跨变量依赖性的强度。这种方法增强了模型的可解释性和适用性。
3.在多个时间序列异常检测基准数据集上的广泛实验证明了该模型的有效性及其卓越的性能,特别是在计算效率和异常检测准确性方面。
本文的结构如下:第2节回顾相关工作。第3节详细介绍了模型的设计和架构,包括训练方法、损失函数和异常检测策略。第4节介绍了实验设置、数据集和结果。第5节讨论了模型的局限性并概述了未来的研究方向。最后,第6节总结了本研究的主要贡献。