MAD-TCN：通过多尺度自适应依赖性时间卷积网络进行时间序列异常检测

时间：2026年2月5日

来源：Neurocomputing

编辑推荐：

针对工业物联网多变量时间序列异常检测中的复杂依赖、长时序建模及计算效率问题，提出MAD-TCN模型。其双分支结构结合局部与全局时序特征提取，自适应门控模块动态调整变量间依赖，实现轻量化设计（约0.026M参数），在四项基准数据集上AUC和F1值最高或次优，且训练与推理速度提升34%。

作者：Yongping Dan, Zhaoyuan Wang, MengZhao Zhang, Zhuo Li

中国郑州中原工业大学集成电路学院，450007

摘要

随着工业物联网系统和其他智能技术复杂性的增加，多变量时间序列中的异常检测在设备健康监测和工业过程控制应用中变得至关重要。现有方法往往难以应对多变量依赖性、时间动态性和计算效率的挑战。因此，本文介绍了一种轻量级且高效的模型——多尺度自适应依赖性时间卷积网络（MAD-TCN），旨在克服这些限制。MAD-TCN采用双分支架构，通过深度可分离膨胀卷积同时利用局部（短期）和全局（长期）时间特征提取，并将其融合以实现多尺度集成。该模型还包括一个跨变量卷积前馈网络和一个自适应门控单元，以动态调整变量之间的依赖关系，从而增强模型处理多维复杂相互依赖性的能力。在四个公共基准数据集（SMAP、SWaT、SMD、MBA）上进行的全面实验，以及与13种最先进方法（包括LSTM-NDT、DAGMM、TimesNet、TranAD和DTAAD）的比较表明，MAD-TCN在异常检测准确性方面表现优异，获得了最高或第二高的AUC和F1分数，同时参数数量仅为约0.026 M。此外，与最佳替代方案相比，MAD-TCN在训练和推理速度上提高了34%。总之，这些实验结果充分证明了MAD-TCN在时间序列异常检测任务中的优越性能，兼具高准确性和计算效率。

引言

随着工业物联网[1]、智能电网[3]和金融风险管理[4]等领域的快速数字化转型，多变量时间序列数据的量正在呈爆炸性增长[5][6]。隐藏在这些数据中的异常事件（如设备故障、网络攻击和系统崩溃）通常具有很强的隐蔽性和突发性，对安全、经济稳定和社会治理构成重大威胁[7]。时间序列异常检测技术通过自动识别偏离正常模式的观测值，为系统健康管理、风险预警和决策提供关键支持[8][9][10]。然而，多变量时间序列异常检测面临几个挑战。首先，多变量耦合导致变量之间的复杂非线性依赖性，使得传统单变量方法难以捕捉跨维度的共现异常[11][12]。其次，时间动态性要求模型同时捕捉短期波动（如传感器漂移）和长期趋势（如设备退化）[13][14]。第三，计算效率瓶颈限制了模型在实时工业监控场景中的应用[15]，因为现有的深度学习方法通常面临高计算复杂性和存储开销[16][17]。

传统的异常检测方法主要依赖于统计和基于规则的模型[18][19]。然而，随着数据维度的增加和数据结构的复杂性提高，这些方法的鲁棒性和适应性往往较差[20]。

近年来，深度学习方法为时间序列异常检测提供了新的方法。特别是循环神经网络（RNN）[21]和长短期记忆（LSTM）[22]网络，凭借其强大的时间序列建模能力，可以捕捉时间序列中的长期依赖性[23]。然而，这些方法仍存在某些缺点[10]，尤其是在建模长时间序列和消耗计算资源方面。例如，LSTM-NDT[24]采用非参数动态阈值方法进行异常检测。尽管它能有效捕捉长期依赖性，但其计算复杂性高且难以并行化，这限制了其在实时检测中的应用。

此外，卷积神经网络（CNN）[25]也被引入用于处理时间序列数据。它们能有效提取局部特征并处理短期依赖性，但在建模长期依赖性方面表现有限。最近的研究（如ModernTCN[26]）提出了深度可分离卷积等改进措施来优化计算效率。然而，这种方法仍然难以充分建模多变量依赖性，也无法完全区分局部和全局时间模式。DTAAD[27]通过结合TCN和Transformer增强了模型对局部和全局模式的建模能力，但在计算效率、模型可扩展性和多变量交互的深度建模方面仍存在某些限制。

尽管基于自注意力机制的图神经网络（GNN）[28]和Transformer模型[29]可以捕捉全局依赖性，但它们通常面临计算复杂性高和训练困难的问题[30]，这限制了它们在实时异常检测任务中的应用[31]。例如，TranAD[32]结合了自注意力机制进行异常检测，在处理复杂数据时表现良好。然而，其计算复杂性和对噪声干扰的敏感性在实际应用中仍然是一个突出问题。相比之下，MAD-TCN基于纯卷积网络架构，通过解耦设计和自适应跨变量依赖性建模有效降低了计算复杂性，同时在处理长时间序列时仍保持高准确性和速度。

为了解决上述问题，本研究提出了一种新的多尺度自适应依赖性时间卷积网络（MAD-TCN）用于时间序列异常检测。该模型引入深度可分离卷积以降低计算复杂性，同时增强模型建模依赖性的能力。此外，还引入了膨胀卷积来克服传统卷积网络在建模长期依赖性方面的局限性。为了实现多变量依赖性的轻量级建模，我们设计了一个自适应跨变量依赖单元（CVA）。

与ModernTCN等最近的TCN变体相比，我们的MAD-TCN在三个方面优化了多变量时间序列异常检测。首先，ModernTCN专注于重新设计单分支TCN模块，通过DWConv和ConvFFN分离时间和特征混合，用于一般预测和分类任务。相比之下，MAD-TCN采用双分支时间架构，结合并行膨胀卷积，一个分支专注于短期局部模式，另一个分支捕捉长期全局上下文。其次，MAD-TCN不仅分离时间和特征维度，还明确引入了自适应跨变量特征融合模块（ACVF）来建模沿变量维度的复杂传感器间依赖性。第三，MAD-TCN的整体设计源于异常检测的特点：异常通常在全局趋势中表现出局部偏差。双分支架构结合CVA使模型对这些特定异常模式更加敏感。在图1中，我们展示了MAD-TCN在轻量级、效率和准确性方面的出色表现。

本研究的主要贡献如下：

我们提出了一种基于双分支深度可分离膨胀卷积的多变量时间序列异常检测模型（MAD-TCN）。该模型通过并行膨胀卷积分支在不同时间尺度上捕捉依赖性，有效提高了多变量时间序列异常检测的精度。

我们提出了一种解耦设计，包括一个与变量无关的多尺度特征提取模块（VIMS）和一个自适应跨变量融合单元（ACVF），其中包含一个跨变量自适应门（CVA）。该设计分别沿三个维度对时间序列数据进行建模：特征维度、变量维度和跨变量依赖性。具体来说，ConvFNN1和ConvFNN2处理特征和变量维度建模，而CVA模块动态调整跨变量依赖性的强度。这种方法增强了模型的可解释性和适用性。

在多个时间序列异常检测基准数据集上的广泛实验证明了该模型的有效性及其卓越的性能，特别是在计算效率和异常检测准确性方面。

本文的结构如下：第2节回顾相关工作。第3节详细介绍了模型的设计和架构，包括训练方法、损失函数和异常检测策略。第4节介绍了实验设置、数据集和结果。第5节讨论了模型的局限性并概述了未来的研究方向。最后，第6节总结了本研究的主要贡献。

节选

深度学习在时间序列建模中的发展

随着深度学习的发展，基于RNN/LSTM[33]的模型通过门控机制缓解了梯度问题，并增强了建模长期依赖性的能力。LSTM-NDT[24]是一种基于LSTM的预测模型，它结合了非参数动态阈值进行异常检测，使其能够适应数据的非平稳性并动态调整检测阈值[34]。然而，其计算复杂性高且

模型架构

本文提出的时间序列异常检测模型MAD-TCN如图2所示。核心设计理念是使用纯卷积架构进行轻量级和高效的实时异常检测。为了增强模型检测复杂异常模式的能力，我们将多尺度时空特征提取与变量间的动态依赖性建模相结合。我们设计了一个多尺度特征提取模块和

实验

为了验证所提出的MAD-TCN模型在时间序列异常检测中的优越性，进行了多项实验，涵盖了不同的应用领域和数据集。评估了模型在不同异常检测任务中的性能。实验包括模型的训练过程、比较实验和综合评估。最终结果证明了该模型在准确性、鲁棒性和计算效率方面的优势。

局限性和未来工作

尽管MAD-TCN在四个基准数据集上表现出竞争力，但仍存在一些局限性。首先，实证评估主要在相对干净的基准数据集上进行；MAD-TCN在严重观测噪声、缺失值和分布污染下的鲁棒性尚未得到严格量化。其次，该模型在分布偏移和跨领域部署（如不同工业过程或传感器）下的泛化能力

结论

本文提出了一种基于纯卷积架构的多变量时间序列异常检测模型，名为MAD-TCN。该模型采用双分支多尺度卷积网络提取局部和全局时间依赖特征，捕捉短期波动和长期趋势，从而从时间序列数据中提取多尺度信息。此外，它集成了一个自适应跨变量融合模块和解耦设计，分别实现

CRediT作者贡献声明

Yongping Dan：撰写——审稿与编辑、监督、资源管理、项目管理、形式分析。Zhaoyuan Wang：撰写——初稿、可视化、验证、软件。MengZhao Zhang：监督、形式分析、概念化。Zhuo Li：撰写——审稿与编辑、监督、方法论、形式分析、数据整理、概念化。