随着智能决策支持技术的快速发展,火灾事故报告和现场调查记录中包含的丰富的但未充分利用的消防安全工程知识越来越受到关注[1],[2]。面对火灾或爆炸事件时,应急响应人员通常遵循一个顺序的四个步骤[3]:(I)人员接收关于潜在或正在发生的事件的通知;(II)他们进行现场检查并收集视觉和环境证据;(III)他们分析文本和视觉证据以推断点火原因和危险趋势;(IV)他们制定并执行灭火或救援策略,同时记录详细的火灾调查报告。
上述过程中的主要瓶颈是第二步和第三步,这两步消耗了大部分可用响应时间[4]。这一瓶颈主要是由于火灾原因推理和战术决策是高度知识密集型的任务,它们严重依赖于跨学科的专业知识和丰富的现场经验。然而,任何单个响应人员的知识储备都是有限的,尽管可以花费额外的时间查阅技术手册或过去的案例,但应急响应操作本质上是时间敏感的,需要在不确定和高压的条件下迅速做出可靠的决定。与纯粹的数据驱动的火灾预测方法[5]相比,最近的研究[6]表明,基于累积的调查文本和视觉证据的推理可以有效提高响应人员在复杂且不断变化的火灾环境中的情境意识和决策能力。因此,应急管理部门迫切需要一个基于知识图的决策支持系统,能够快速访问、组织和推理累积的火灾调查知识,以提高应急决策的效率和一致性。
研究人员越来越多地采用知识图(KG)技术来开发特定领域的决策支持系统和专家推理框架[7],[8],[9],[10]。在火灾调查和安全应用中,以图形形式组织的KG在明确表示点火原因、危险物质、火灾蔓延模式和灭火策略方面也起着关键作用[11],[12]。最近的安全相关研究进一步强调了结构化知识表示在理解因果链和多危险相互作用中的重要性[13],[14]。一般来说,现有的基于KG的推理方法可以分为本体驱动和概率建模两种范式。基于本体的系统依赖于专家定义的关系进行结构化推理[15],[16],而概率方法(如贝叶斯网络)则用于模拟火灾传播和危险升级的不确定性。然而,这两种框架都需要大量的手动工作来从冗长的报告和视觉证据中提取结构化信息,导致知识更新缓慢和有价值的历史记录未被充分利用。
基于深度学习的自然语言处理方法越来越多地被用于自动化实体和关系的提取。例如长短期记忆(Long Short-Term Memory)、Transformer以及Transformer的双向编码表示(Bidirectional Encoder Representations)[17],[18],[19],[20]等方法能够从大量的文本火灾调查记录中自动提取词嵌入和语义特征,从而有助于构建机器可解释的知识图。这些方法已成功应用于事件推理、时间演化建模和灭火策略优化。然而,大多数现有方法主要关注文本内容,而忽视了评估火灾行为、点火源类型和灭火可行性所关键的视觉线索。此外,缺乏可解释的推理机制限制了它们在现实世界紧急场景中的可靠性。
与此同时,视觉语言模型(VLM)在多模态理解方面取得了重大突破,因为它们能够同时处理图像和文本[21],[22],[23]。像GPT-4V、Gemini和Qwen2.5-VL-7B这样的先进模型在复杂的感知任务和安全关键场景中展示了出色的推理能力。然而,尽管它们具有通用智能,但VLM并不具备准确推断火灾原因和做出灭火决策所需的专门领域知识。最近的安全科学研究[24]表明,大型语言模型驱动的代理可以模拟疏散或响应决策,但在缺乏领域约束的情况下,它们在一致性和事实准确性方面存在困难。因此,将结构化的火灾知识纳入此类多模态框架对于弥合通用推理能力和领域特定可解释性之间的差距至关重要。
在这种情况下,研究人员开始探索将知识图与大型模型相结合的混合架构,以实现可解释和上下文感知的推理[25],[26],[27]。这些研究表明,结合结构化的领域知识显著提高了决策支持系统的透明度和可靠性。在Chain-of-Thought[28]和Tree-of-Thought[29]等推理范式的基础上,混合KG-VLM框架可以进一步整合视觉证据、文本语义和基于图的推理,以实现情境适应性的理解。最近的框架如Think-on-Graph[30]、REACT[31]和Fact Finder[32]展示了知识增强模型在可解释决策支持方面的潜力。然而,大多数这些模型仍然局限于通用问答(QA),而不是现实世界的紧急推理。
为了解决这些不足,本文提出了一种新的知识图和VLM决策支持框架KG-DS,它将消防安全工程知识形式化为明确的、机器可解释的结构,并利用这些知识来支持高度知识密集型的火灾紧急决策任务。该框架由两个核心模块组成。首先,通过自动实体-关系提取,从火灾调查报告和相关文档中构建火灾事故知识图(FIKG),编码点火源、可燃材料、危险和灭火行动的结构化表示。其次,基于VLM的推理模块整合文本、视觉和FIKG知识线索,生成全面的决策支持输出。该模块进行情境适应性推理,生成简化的公共指导和详细的专业策略。总之,本研究做出了几项关键贡献:
- 1.
为了形式化消防安全工程知识,我们开发了一种关系导向的联合三元组提取模型(RO-JTEM),它从火灾调查文本中识别关系并提取事件实体,以构建FIKG。
- 2.
VLM作为代理,操作FIKG中编码的结构化工程知识,结合基于图的检索和多模态感知来推荐适当的灭火策略。
- 3.
我们在一个包含来自中国23个省(2014-2025年)的500份火灾和爆炸调查报告的真实世界数据集上进行了全面实验。结果表明,所提出的KG-DS框架为各种火灾场景提供了准确、可解释和实用的决策支持结果。