Juan Xu|Zhengyu Deng|Mingguang Dai|Xinhang Yu|Xu Ding|Ruqiang Yan
合肥工业大学计算机与信息学院,中国合肥
摘要
准确预测机械设备的剩余使用寿命(RUL)对于确保机械系统的安全性和可靠性至关重要。然而,现有的基于深度学习的RUL预测方法在处理复杂的多变量时间序列数据时,往往面临可解释性和鲁棒性方面的挑战。为了解决这个问题,本文提出了一种基于自适应阈值聚合因果发现的多变量RUL预测方法。具体来说,采用基于贝叶斯信息准则(BIC)的因果发现方法来探索多个样本之间变量(即传感器信号)之间的关系,从而生成相应的因果图。然后设计了一种自适应阈值机制,将这些样本级别的图聚合为一个全局结构,突出显示关键依赖关系。在此基础上,通过结合前门和后门调整方法进行因果效应估计,生成因果效应矩阵。该矩阵与多变量时间序列数据一起输入到时间图卷积网络(T-GCN)中,以捕捉动态依赖关系和因果关联,用于RUL预测。在C-MAPSS数据集上的实验结果表明,所提出的方法平均均方根误差(RMSE)为13.3,优于现有的最佳基准方法,并提供了更可靠和可解释的RUL预测见解。
引言
为了确保机械设备的可靠性和安全性,近年来对剩余使用寿命(RUL)的预测受到了广泛关注。RUL是指从当前时刻开始,设备能够安全稳定运行的预期时间,直到不可避免的故障发生[1]、[2]、[3]。RUL预测的核心在于准确捕捉和建模来自机械设备的复杂多变量传感器时间序列数据,这些数据全面反映了设备在退化过程中的状态变化,从而实现精确的RUL预测[4]、[5]。
传统的基于深度学习的RUL预测方法,如长短期记忆(LSTM)网络[6]、[7]、[8]和门控循环单元(GRU)[9]、[10],主要依赖于数据中的统计相关性来从历史数据中学习退化特征并进行建模[11]、[12]。例如,Peringal等人[6]提出了一种基于LSTM的方法,并采用保守的损失函数来提高飞机发动机RUL预测的可靠性。然而,在处理来自机械设备的多变量时间序列(MTS)数据时,这些方法面临两个主要问题:首先,统计相关性模型通常无法揭示多变量数据中的潜在因果关系,导致模型预测结果的可解释性较差;其次,现有模型通常难以捕捉数据特征的动态变化,从而在动态环境中的泛化性能较差。因此,将因果关系纳入RUL预测模型以提高其可解释性和鲁棒性已成为MTS RUL预测中的一个关键问题。
最近,因果发现方法在时间序列数据分析领域发展迅速[13]、[14]。例如,Zheng等人[13]提出了一种基于因果图的空间-时间注意力网络,该网络利用传感器变量之间的因果结构来增强复杂系统的RUL预测。与传统的基于相关性的深度学习模型相比,因果发现可以揭示多变量数据之间的因果结构[15]、[16],从而避免了仅依赖统计相关性的误导性影响[17]、[18]。
然而,不同样本之间的因果图往往缺乏一致性,可能会引入噪声并降低因果图的准确性。因此,如何构建一个跨多个样本的鲁棒因果图,并有效地将其应用于剩余使用寿命(RUL)预测仍然是一个未解决的问题。
为了解决这些问题,我们提出了一种基于自适应阈值聚合因果发现的多变量RUL预测框架,该框架推进了MTS数据中的因果分析。具体来说,使用自适应阈值策略融合了特定于样本的BIC因果图,该策略量化了边的稳定性并优化了全局一致性,同时保持了无环性,生成了一个代表异构时间序列的鲁棒因果结构。然后通过双路径因果效应估计将这些因果图转化为定量指导,利用后门和前门调整来测量传感器信号之间的方向性影响。最后,将因果效应矩阵与原始MTS数据一起输入到T-GCN[19]、[20]架构中,其中图卷积层优先考虑强因果链接,GRU层捕获时间退化趋势。
本文的主要贡献如下:
- 1.
我们提出了一个基于因果效应的多变量RUL预测框架,通过将因果效应矩阵嵌入到T-GCN架构中。该矩阵指导GCN层优先考虑强因果链接,并指导GRU层捕获时间退化趋势,使模型能够明确利用物理系统的因果关系来优化特征权重分配,从而提高RUL预测能力。
- 2.
为了解决多变量时间序列场景中因果图的异质性问题,我们提出了一种基于自适应阈值的因果发现聚合方法。通过量化因果边的稳定性并优化全局一致性,可以从样本差异构建一个稳定的全局因果图。这种动态阈值机制能够整合异构信息,解决了传统因果发现方法在处理多变量RUL预测任务时鲁棒性不足的问题。
因果发现的相关工作
因果发现旨在通过学习有向无环图(DAG)来揭示多变量时间序列(MTS)数据中的潜在因果结构,该图捕获变量之间的方向性依赖关系。现有的因果发现方法通常分为两大类:基于约束的方法[21]和基于得分的方法[22]。
基于约束的方法依赖于条件独立性测试和置信度指标来确定因果链接。
问题定义
我们考虑基于多变量传感器时间序列数据的剩余使用寿命(RUL)预测任务。每个发动机单元生成一系列传感器数据
其中M是传感器的数量,T是序列长度。相应的RUL序列表示为
为了便于模型训练,序列被分割成长度为
训练数据集定义为
目标是
NASA发布的C-MAPSS数据集作为涡轮风扇发动机退化预测的基准数据集。它模拟了多个发动机从初始运行到故障的整个生命周期退化过程,涵盖了在不同工作条件和故障模式(如温度、压力和振动)下21个传感器收集的测量数据。该数据集分为四个子集(FD001-FD004),每个子集代表不同的工作设置和故障场景
本研究提出了一种用于机械系统中多变量RUL预测的因果增强型时间图神经网络。该框架整合了多样本因果发现的自适应阈值聚合、双路径因果调整(前门和后门)进行因果效应估计,以及具有滑动窗口处理的时间图卷积网络(T-GCN),以共同建模因果依赖关系和时间动态。在航空航天发动机上的实验验证表明
Juan Xu:撰写——审稿与编辑、方法论、研究。Zhengyu Deng:撰写——原始草稿。Mingguang Dai:资金获取。Xinhang Yu:资金获取。Xu Ding:监督。Ruqiang Yan:监督。
作者声明以下可能被视为潜在利益冲突的财务利益/个人关系:
Juan Xu报告获得了国家自然科学基金的支持。Juan Xu还获得了江淮先进技术中心的Dreams基金的支持。如果还有其他作者,他们声明没有已知的财务利益或个人关系可能影响所报告的工作