迈向可泛化的故障诊断:在不同故障严重程度下学习不变的特征

时间:2026年1月20日
来源:Chinese Journal of Chemical Engineering

编辑推荐:

提出一种基于互信息驱动的特征分解与类一致性约束的单域泛化故障诊断方法GCCNet。通过构建不同激励强度下的同类故障数据样本,在训练过程中强化任务相关特征的可迁移性,解决传统方法依赖伪域生成和特征不稳定的缺陷。在Tennessee Eastman过程和工业数据集上验证,GCCNet在未知工况下展现出更好的泛化能力和诊断鲁棒性。

广告
   X   

张一鸣|史洪波|宋冰|陶阳
教育部能源化工过程智能制造重点实验室,华东理工大学,上海,200237,中国

摘要

确保故障诊断模型的泛化能力对于维持在多样化条件下运行的工业系统的长期安全性至关重要。本研究提出了一种新颖的方法,称为通用类一致性网络(GCCNet),旨在提高在先前未见过的运行条件下的诊断鲁棒性。具体而言,GCCNet结合了基于互信息的特征解耦机制来提取与任务相关的表示。为了进一步促进特征不变性,使用相同类别的故障数据在不同激励强度下构建辅助样本,并在训练过程中应用类一致性正则化来强制进行一致的预测。这引导网络将与任务相关的特征净化为可转移且鲁棒的表示。在Tennessee Eastman工艺和工业数据集上进行的广泛实验验证了所提出方法的有效性和泛化能力。

引言

随着现代工业过程规模和复杂性的增加,开发有效的故障诊断方法变得越来越具有挑战性[1]。近年来,数据驱动的智能诊断取得了显著进展。深度神经网络凭借大量数据得到了广泛应用,因为它们可以提取具有区分性的特征并准确分类测试样本。然而,在实际的工业环境中,生产设置、运行条件和产品规格的变化经常导致过程在不同的模式下切换。因此,测试样本的分布可能与历史数据不同[2]。
大多数故障诊断方法依赖于历史数据,假设训练样本和测试样本具有相同的分布[3],[4]。当这一假设因分布变化而被违反时,模型性能会下降,通常会出现更高的误报率。尽管使用新模式的标记数据进行重新训练可以缓解这一问题,但这既昂贵又低效[5]。为了减少对标记数据的依赖,领域适应方法利用目标领域的未标记样本来指导模型学习领域不变的表示。代表性的方法包括基于距离的方法[6],[7],[8]和基于对抗训练的方法[9],[10]。尽管取得了进展,但仍存在一些挑战。首先,在训练期间从新运行模式获取未标记数据通常是不切实际的。其次,领域适应方法高度依赖于特定的目标领域,使得得到的模型仅对观察到的领域有效,而对未见或未知的模式没有理论保证。
基于领域泛化(DG)的故障诊断受到了越来越多的关注,因为它使模型能够在没有目标领域数据的情况下泛化到未见过的运行条件[7]。最近的研究从两个互补的角度提高了DG的性能:不变特征提取和特征增强。
基于不变表示学习的方法旨在通过特征解耦或跨领域对齐来指导模型捕获领域不变的特性。Ren等人[11]利用拓扑相似性约束和参数共享图神经网络来学习多个源领域的不变图表示,从而增强了下游软传感任务的泛化能力。Hu等人[12]研究了不同故障类型之间的因果关系,并通过提取每个故障类别内的共同和特定非平稳变化来进行在线诊断。Li等人[13]提出了一种不平衡感知的对抗训练策略,以提高特征提取器的领域混淆能力,从而提高传输诊断的准确性。此外,基于GRU的模型[14]已被用于捕获工业过程数据中的不变和领域特定的时间表示。另一条研究路线引入了元学习策略来加强表示。Zhao等人[15]提出了一种针对未见领域故障诊断的对抗信息引导方法,其中互信息游戏鼓励学习不变特征。Wang等人[16]提出了MSG-ACN框架,通过多尺度风格生成增强源领域表示,然后通过对抗对比学习学习不变性。与多领域DG相比,单领域泛化更具挑战性,因为缺乏明确的跨领域变化,使得不变特征学习变得更加困难。为了解决这个问题,基于特征增强的DG方法构建了伪领域或增强了源领域的多样性。Guo等人[17]引入了使用深度可分离卷积网络的领域生成机制。Zhang等人[18]利用反事实推理来推断领域变化的因果因素并相应地生成伪领域。Li等人[19]通过受限函数生成可控的领域增强样本,并使用对抗对比训练优化了双分支融合网络。Jian等人[20]提出了一种基于梯度的领域增强元学习(GDM)方法来生成伪领域并训练泛化模型。Tang等人[21]开发了一种直方图匹配混合(HMM)数据增强技术,在训练过程中生成语义一致但分布多样的样本。尽管这些方法有效,但许多伪领域生成方法的可解释性有限。为了解决这个问题,Zheng等人[22]使用先验知识生成了跨领域一致的数据,Wan等人[23]提出了一种元卷积神经网络来加强单领域场景中的元特征学习。Kim等人[24]进一步引入了一个物理信息驱动的SDGPI框架,将领域知识嵌入神经网络以实现物理上可解释的泛化。
尽管上述方法表现出了有希望的性能,但仍存在几个关键挑战。首先,许多现有方法严重依赖于伪领域生成来模拟领域变化,但模型性能对生成领域的质量和多样性非常敏感。其次,运行条件的变化通常会导致故障分布高度不平衡,这给许多基于不变特征的DG方法收集足够多样化的多领域数据带来了挑战。最后,很少有方法明确强制类内特征的一致性,留下了进一步提高泛化鲁棒性的空间。
为了解决上述挑战,本文提出了一种用于单领域泛化的通用类一致性网络(GCCNet)。GCCNet通过整合特征解耦和类内一致性建模来增强泛化能力。它包括两个训练阶段:互信息正则化解耦阶段和一致性约束泛化阶段。
在第一阶段,GCCNet采用基于互信息的解耦机制来明确区分与任务相关的特征和与任务无关的特征。与通常难以确保生成样本真实性的数据生成策略不同,我们使用在不同激励强度下收集的相同故障类型的响应数据构建了补充的源样本。这种方法确保了样本之间的物理一致性。例如,在模拟的空气管道泄漏场景中,操作员逐渐增加阀门开度,并在收集数据之前监控流量是否在设定点附近稳定。这个过程在每个阀门设置下产生了物理上有意义的数据。在第二阶段,基于之前提取的与任务相关的特征,我们进一步结合了原始源数据及其在不同激励水平下的变体。通过强制一致性正则化约束,模型被引导学习同一类别内的不变特征,从而提高了其对未见领域的鲁棒性和泛化能力。我们在Tennessee Eastman Process(TEP)和工业数据集(Pronto)上验证了GCCNet的有效性。实验结果表明GCCNet优于现有方法。本工作的主要贡献总结如下:
  • (1)
    我们提出了一个类一致性约束的单领域泛化框架GCCNet,它整合了特征解耦和一致性学习。GCCNet在不依赖伪领域生成的情况下,有效地提高了在先前未见过的运行模式下的故障识别能力。
  • (2)
    我们设计了一个基于互信息正则化的解耦模块,该模块明确区分了与任务相关的特征和与任务无关的特征。这提高了特征的可区分性,并为泛化提供了可靠的表示基础。
  • (3)
    我们引入了一种一致性约束的泛化机制,该机制利用相同类别样本在不同激励条件下的响应数据。这引导模型学习类内不变特征,从而提高了与任务相关表示的稳定性和泛化能力。
本文的其余部分组织如下。第2节介绍了问题定义和我们的方法背后的动机。第3节介绍了提出的GCCNet方法。第4节展示了实验结果和分析。第5节总结了本文的结论和未来工作的想法。

部分摘录

符号和问题定义

在化学过程中,运行条件的变化会导致过程数据分布的变化,这意味着收集的现场数据本质上反映了多种运行条件。即使在调整设定点后以稳态收集数据,不同稳态下获得的数据的统计属性也可能有很大差异。在本研究中,在相同设定点下收集的过程数据(包括正常数据和故障数据)被定义为一个领域D

方法论

GCCNet(通用类一致性网络)的网络结构如图2所示。它由两个模块组成:互信息正则化解耦模块和一致性约束泛化模块。在模块1中,单源领域数据被输入网络,并由特征提取器处理以获得初始表示f。在损失函数的指导下,特征提取器Eirf中提取与任务无关的特征fir

案例研究1:Tennessee Eastman Process

Tennessee Eastman Process(TEP)是一个模拟真实化学过程的平台,已被广泛用作过程监控和故障诊断的基准。TEP包括一个反应器、冷凝器、气液分离器、循环压缩机和产品分离器。该过程涉及四种气态反应物和惰性组分,产生两种液态产品G和H。TEP共有22个过程测量变量、19个组成变量和12个

讨论与结论

在这项研究中,我们提出了一种新颖的通用类一致性网络(GCCNet),以提高模型在先前未见过的运行条件下分类故障的泛化能力。这项工作解决了现有单领域泛化方法的两个关键限制:来自伪领域的特征的不稳定性,以及指导模型有效提取领域不变特征的难度。
GCCNet引入了基于互信息的解耦

CRediT作者贡献声明

宋冰:写作——审稿与编辑、资金获取、形式分析。陶阳:写作——审稿与编辑、资金获取、形式分析、概念化。张一鸣:写作——原始草稿、验证、软件、方法论、调查、数据整理。史洪波:写作——审稿与编辑、资金获取、形式分析、概念化

利益声明

作者声明他们没有已知的竞争财务利益或个人关系可能影响本文报告的工作。

致谢

本工作得到了国家自然科学基金(编号62473154、62473155和62473156)的支持。

生物通微信公众号
微信
新浪微博


生物通 版权所有