基于时间因果图的门控循环单元(Attention Gated Recurrent Unit)在核电站可解释性故障诊断中的应用

时间:2026年2月2日
来源:Reliability Engineering & System Safety

编辑推荐:

智能故障诊断在核电站(NPP)中至关重要,但传统数据驱动模型存在可解释性差、依赖欧氏空间数据等问题。本文提出基于时序因果图与GraphAttGRU-Cell网络的系统级诊断方法,通过融合领域知识与数据驱动构建动态因果图,设计细胞级注意力与门控机制捕捉时空依赖,显著提升诊断精度和可解释性。

广告
   X   

Jie Liu|Kai Pan|Enrico Zio|Yuantao Yao
北京航空航天大学可靠性与系统工程学院,中国北京100191

摘要

智能故障诊断对于核电站(NPPs)的安全运行至关重要,但由于复杂的架构和动态时间序列数据,仍然存在诸多挑战。此外,传统数据驱动模型的黑箱特性也阻碍了其在故障诊断场景中的实际应用。为了解决这些问题,本文提出了一种基于时间因果图的门控循环单元网络(GraphAttGRU-Cell),该网络结合了单元级别的图注意力机制,以实现可解释且高效的系统级故障诊断。首先采用了一种时间因果发现方法,将领域专业知识与数据相结合,以学习稳定的、可信的时间因果图,该图能够捕捉来自多变量传感器数据的即时和滞后依赖关系。所提出的GraphAttGRU-Cell网络是从单元级别自下而上设计的,其中注意力机制和门控机制可以捕捉图中的空间和时间特征。通过模拟的第四代核电站(Gen-IV NPP)事故数据集验证了该方法的有效性。实验结果表明,该方法在准确性和可解释性方面显著优于现有的最佳基线方法,为核电站的维护决策提供了一个强大且易于理解的工具。

引言

核电站(NPPs)是高度复杂和非线性的动态系统,包含众多控制设备和传感器,这些设备和传感器收集多变量时间序列数据(MTSD)。目前,这些设备仍然严重依赖人工检查和维护,存在自动化程度低、效率低下和运营成本高等问题,迫切需要智能技术的支持[[1], [2], [3], [4], [5], [6]]。此外,由于核蒸汽供应系统中存在放射性物质,因此需要持续监控,这依赖于内置的传感器。因此,基于监控信号的智能故障诊断对于确保核电站的安全可靠运行至关重要。人工智能技术的快速发展为智能诊断和维护提供了可行性。近年来,像机器学习(ML)和深度学习(DL)这样的数据驱动方法因其灵活性和强大的能力而变得流行[[7], [8], [9], [10], [11], [12], [13]]。通过利用多源异构数据,这些方法可以模拟核站在稳态和瞬态条件下的非线性、时变行为。
现有的基于AI的核电站故障诊断方法可以分为两类:设备级方法和系统级方法。设备级模型需要逐个集成,这增加了运营和维护的工作流程复杂性[[14], [15], [16]]。相比之下,系统级方法更适合核电站故障诊断,因为它们能够进行高效和集中的根本原因及传播分析。例如,Lim等人[17]提出了一种使用红外热成像的卷积神经网络(CNN)模型,用于快速检测关键核电站组件的异常。Liu等人[18]开发了一种长短期记忆网络(LSTM)诊断模型,用于压水反应堆,结合确定性和不确定性分析来准确检测事故。但这些数据驱动方法处理的是欧几里得数据,忽略了工业系统的拓扑结构和组件间的依赖关系。这一限制最终限制了这些模型的性能和可解释性。
为了解决这些挑战,图神经网络(GNNs)越来越多地应用于系统级诊断。通过节点和边属性表示复杂关系,GNNs能够有效捕捉工业系统中的拓扑结构和非欧几里得依赖关系。代表性的模型包括图卷积网络(GCNs)[19]、图注意力网络(GATs)[20]和图自编码器(GAE)[21],它们利用归纳偏见从高维图数据中学习模式[22]。Jonas等人[23]提出了一种基于GNN的核光伏系统故障诊断模型,基于逆变器电流-电压数据实现了强大的泛化能力。Seo等人[24]引入了一个结合拓扑邻接矩阵和传感器特征的GAE-GCN框架,用于氢提取系统的异常检测。最近的研究还探索了GNNs在事故和事件诊断中的应用。Guo等人[25]开发了一种基于GNN的链接预测模型,用于揭示建筑施工中危险对象之间的潜在交互。Tran等人[26]提出了一种多结构GNN,用于大型交通网络中的事件预测,并通过融合异构数据源提高了诊断准确性。鉴于传感器信号的时空特性,时空GNNs(ST-GNNs)被用来模拟空间拓扑和时间动态。Wang等人[27]提出了一种基于注意力的ST-GNN,用于故障诊断,有效合并了多传感器数据以提高齿轮箱数据集的诊断准确性。Wei等人[28]提出了一种ST-GCN,用于预测电路中的无声数据错误,增加了故障影响概率和仿真效率。然而,大多数现有的GNN/ST-GNN诊断模型仍然难以解释,因为它们学习到的图结构、注意力权重和嵌入无法提供清晰的解释或可行的根本原因洞察。
作为可解释AI(XAI)的一部分,已经开发了诸如LIME[29]、SHAP[30]和Integrated Gradients[31]等解释工具来增强可信度。对于图模型,事后解释器可以突出显示有影响力的节点、边或特征,例如GNNExplainer[32]和PGExplainer[33]。这些XAI技术旨在通过提供决策透明度来提高模型的可解释性,这对于核电站等安全关键系统的故障诊断至关重要。最近的基于GNN的故障诊断研究也采用了这些理念。Chanda等人[34]提出了一种异构多任务GNN,使用GNNExplainer来识别智能电网故障事件的关键节点。Li等人[35]提出了一种基于InputXGradient的解释GCN方法,用于建筑能源系统的故障诊断,将故障定位与专家知识对齐。Akkas等人[36]为GNN预测设计了基于Shapley值的解释,提供了可扩展的边级属性。尽管在透明度方面取得了这些进展,但大多数解释仍然依赖于相关图或专家定义的结构,忽略了潜在的因果关系。这种限制可能导致与真实系统操作逻辑和时变机制的偏差。
因果关系是科学推理中的基本原理,描述了变量如何相互因果作用,比统计概念相关性提供了更精确的信息[37,38]。因果图是有向无环图(DAGs),其中边代表因果关系,可以模拟物理环境中的核电站操作流程。因果发现是指学习带有因果解释的图结构的过程[39]。现有的因果发现方法通常分为基于约束的方法、基于得分的方法和混合方法。基于约束的方法侧重于条件独立性测试,如PC[38]和FCI[40]。基于得分的算法利用DL技术优化结构学习目标,包括代表性的NOTEARS[41]和DAG-GNN[42]。基于因果发现的AI方法越来越多地应用于复杂工业系统的故障诊断,因为它们可以揭示真实的因果关系,从而提高诊断准确性和可解释性。一些研究专注于结合因果图的GNN方法。Zheng等人[43]提出了一种分层图卷积注意力网络,嵌入了因果路径以改进机电系统中的故障检测。Miraki等人[44]提出了一种可解释的因果GNN,用于配电和家庭级别的负荷预测,为运营决策提供可解释的预测。除了基于GNN的方法外,另一条研究路线专注于因果生成建模。例如,Wang等人[45]提出了一种结合先验约束的因果发现和图解耦及因果GAN的反事实数据生成方法,用于故障诊断。这些因果方法可以分析监控数据,以识别根本原因和传播路径,从而提高模型透明度。然而,许多方法依赖于静态因果图,忽略了时空耦合,限制了它们捕捉实际核电站操作中时变机制的能力。
对于时间序列数据,时间因果发现可以揭示变量之间的因果效应,使其特别适合描述核电站中MTSD的复杂时间动态。尽管具有数据分析潜力,但基于时间因果图的核电站故障诊断仍研究不足。为了填补这一空白并满足实际需求,我们提出了一种基于时间因果图的单元级别图注意力门控循环单元(GraphAttGRU-Cell)网络,用于实现可解释的系统级核电站故障诊断。首先采用了一种结合领域专业知识和数据的时间因果发现方法,能够识别切片间和切片内的因果关系。GraphAttGRU-Cell网络利用了一种新颖的单元级别架构,结合了注意力和门控机制,从多变量传感器数据中捕捉复杂的时空依赖关系。通过利用时间因果图,我们的方法实现了准确、稳健且可解释的诊断性能。本研究的主要贡献如下:
  • 1)
    提出了一种时间因果发现框架,将数据驱动学习与领域专业知识相结合,使空间和时间依赖关系能够独特地融入核电站诊断过程。
  • 2)
    提出了一种新颖的GraphAttGRU-Cell网络,用于捕捉随时间变化的动态因果结构。多头注意力和门控机制的结合有效地从核电站监控信号中提取了时空特征,显著提高了诊断准确性。
  • 3)
    在一个模拟的核电站数据集上的案例研究验证了该方法定位故障根本原因和传播路径的能力,证明了其高准确性、可解释性、稳健性和工程实用性。
  • 本文的其余结构如下。第2节详细介绍了基于时间因果图的GraphAttGRU-Cell网络框架,用于核电站系统故障诊断。第3节提出了一个核电站模拟数据的案例研究,并进行了比较、模型可解释性和稳健性分析。最后,第4节总结了研究结果并指出了未来工作的方向。

    方法论

    所提出的可解释故障诊断框架如图1所示。它由两个主要部分组成:时间因果发现模块和用于故障诊断的GraphAttGRU-Cell网络。时间因果发现算法创新性地结合了领域知识,构建了一个编码传感器变量之间即时和滞后依赖关系的时间因果图。专家知识和数据的融合有助于获得更稳定和可信的时间因果结构

    数据描述和预处理

    本研究的数据集来自中国科学院核能安全技术研究所(INEST, CAS)开发的集成实验和仿真建模平台,如图5所示。该平台不断升级,用于第四代核电站(Gen-IV NPP)技术的智能设计、建造、运营和维护以及退役。它还可以实现状态监控、早期事故预警、故障诊断和设备维护规划

    结论

    鉴于核电站系统的时空动态性和对可解释性的日益增长的需求,本研究提出了一种基于时间因果图的GraphAttGRU-Cell网络,为在复杂工业场景中应用时间因果ML方法提供了坚实的理论和技术基础。开发了一种基于领域知识的时间因果发现策略,构建了一个包含监控数据之间即时和滞后依赖关系的时间因果图
    CRediT作者贡献声明
    Jie Liu:撰写——原始草稿、方法论、概念化。Kai Pan:撰写——原始草稿、验证、软件、方法论。Enrico Zio:监督、资源获取、资金筹集。Yuantao Yao:撰写——原始草稿、验证、资金筹集、数据整理。

    生物通微信公众号
    微信
    新浪微博


    生物通 版权所有