建筑机械在现代基础设施发展中发挥着基础性作用,是城市建设、交通网络、能源设施和采矿作业等大型项目的支柱[1]。随着全球建筑行业的持续扩张,对建筑机械的需求迅速增长[2]。建筑机械也是实现自动化和智能化操作的关键因素。它们涉及广泛的人机交互,覆盖大面积的操作区域,并且经常在恶劣的施工环境中运行[3]。因此,减少维护停机时间以降低风险至关重要。液压系统(通常包括液压缸、控制阀、泵和电机)的故障约占建筑机械故障的70%[4]。这些故障具有多样的类型、复杂的原因和解决方案以及复杂的相互关系。因此,在维护建筑机械的液压系统时,故障诊断是一个关键方面。
目前,建筑机械液压系统的故障诊断依赖于原始设备制造商(OEM)及其供应商的服务工程师进行的离线事后诊断。这种依赖经验的方法已无法满足故障诊断的准确性和及时性要求。因此,需要一种具有更高诊断准确性、更低停机时间和更低维护成本的建筑机械液压系统智能故障诊断方法。
事实上,建筑机械液压系统的故障诊断报告已被存档,其中包含故障描述、原因和解决方案。尽管这些报告具有重要的参考价值,但它们的利用效率低下。本文旨在从多个知识源构建故障知识图,既能表示领域特定故障语料库中的语义知识,也能表示复杂多跳因果链中的图结构知识。基于此,本文实现了智能故障诊断,利用了包括主动学习、预训练语言模型和图神经网络在内的新兴技术,显著提升了知识图和智能故障诊断的性能。在实际工程应用中,需要解决四个技术挑战:
(1) 需要标注领域特定的语料库来训练故障知识提取模型,但获取大量手动标注的语料库既困难又成本高昂。
标注对于训练知识提取模型至关重要,但在建筑机械液压系统故障诊断这一专门领域,获取足够的标注语料库具有挑战性。这是因为该领域涉及高度专业化的知识,需要专家工程师参与,且标注过程本身既耗时又昂贵。
(2) 故障诊断报告由不同的工程师记录,缺乏标准化指南,导致表达不一致。
由于缺乏记录故障、原因和解决方案的标准,加上不同工程师之间的表达差异,常常导致记录过于简洁、冗余或不一致。这些问题共同导致故障知识图中出现重复实体,降低了其整体质量。
(3) 智能故障诊断中的知识图包含复杂的多跳因果链,可能存在遗漏和错误。
建筑机械液压系统的故障涉及多个组件和复杂机制,具有多样的类型、原因和相互关系,这常常导致知识图中的复杂多跳因果链中出现遗漏和错误。
(4) 使用智能故障诊断系统时,不规则和不一致的用户输入会增加知识检索的难度。
即使有标准化指南,工程师记录故障的方式也常常不一致——这一问题在建筑机械领域比在许多其他工程领域更为严重。这阻碍了智能故障诊断系统完全理解工程师的输入并检索相应的故障知识。
因此,本文的主要研究贡献包括:
(1)基于主动学习的BERT + Bi-LSTM + CRF故障知识提取。BERT + Bi-LSTM + CRF用于准确提取故障实体和关系,同时采用主动学习策略来解决获取大量手动标注语料库的难题。
(2)基于词嵌入的故障实体对齐。引入了一种基于预训练语言模型的两阶段词嵌入技术,以充分学习故障实体的语义知识并生成词嵌入。这解决了相同或相似故障知识表达不一致的问题。
(3)基于知识图嵌入的故障知识推理。提出了NSHPSAGE图嵌入模型,以充分捕获故障知识图中的图结构信息并生成图嵌入。多头注意力融合将词嵌入和图嵌入融合为节点嵌入,然后通过二元运算符生成链接嵌入。接着进行链接分类,以解决复杂多跳因果链中的遗漏和错误。
(4)基于词嵌入的故障知识检索。所提出的词嵌入模型将工程师的输入转换为词嵌入,以检索最相关的“故障”节点并推荐相应的故障原因和解决方案,解决了用户输入不一致的问题。