与其他行业相比,化学行业发生灾难性事故的频率更高。这些事件通常涉及火灾、爆炸或有毒物质接触造成的急性伤害(Soltanzadeh等人,2022年)。化学制造本质上涉及易燃和易爆的原料以及复杂的工艺流程。因此,缺乏严格的过程控制很容易导致严重的生产安全事故。此类事件对人类生命、财产和整体社会稳定构成严重威胁(Wang等人,2024年)。因此,减轻生产风险和实现化学行业的有效事故预防是一个重要的现实研究课题,需要深入研究(Lin等人,2024年)。
为了提高化学事故的预防和风险管理能力,深入探索其因果机制具有重要意义。然而,目前的事故因果识别过程仍然严重依赖人工判断。一些研究表明,基于主观判断的因果识别容易受到研究者认知结构和经验差异的影响。因此,这种方法往往难以确保客观性和一致性(Jiao等人,2024年;Shi等人,2024年)。此外,一些学者认为,在处理大规模报告时,手动提取风险因素效率低下(Tao等人,2025年)。例如,Lin等人(2024年)从中毒或窒息事故报告中提取并分类了“直接原因”和“间接原因”的文本信息。在总结相似的风险因素后,他们使用关联规则和贝叶斯网络来评估这些因素的影响。通过对41起严重和重大化学生产事故的统计分析,Li等人(2024年)发现爆炸是这一类别中的主要事故类型,“其他爆炸”和“容器爆炸”分别占总数的37.8%和33.3%。主要事故原因集中在违反生产规定上,占总数的43.9%。Li和Yang(2022年)根据事故统计数据寻找风险因素。他们使用Apriori算法来发现事故数据中的关联。他们具体分析了人为因素、事故发生的时间和月份以及各种事故类型之间的联系。研究的四个主要事故类别是泄漏、爆炸、火灾和中毒或窒息。Tao等人(2025年)首先手动应用CREAM方法识别风险因素和因果链,然后构建了一个化学企业的安全风险网络来研究这些风险因素之间的关系。Li等人(2020年)通过统计分析事故调查报告并编码事故原因,构建了一个原始的贝叶斯网络。然后计算贝叶斯网络中每个节点的故障敏感性,以发现事故原因之间的关系。Li等人(2023年)通过统计分析事故案例获得事故原因。基于关联规则,他们为化学爆炸事故开发了一个故障树结构,将定性模型转化为定量贝叶斯网络模型。该模型用于揭示事故传播路径、基本事件的重要性以及事故直接原因的敏感性。
上述研究在促进因果识别的系统化和加深对事故机制的理解方面发挥了积极作用。然而,手动方法存在效率低下和可扩展性差的问题。为了进一步克服手动识别方法的局限性,研究人员开始尝试引入数据挖掘工具。例如,Niu等人(2019年)利用潜在狄利克雷分配(LDA)主题建模和社会网络分析(SNA)等技术进一步识别和理解事故数据。他们根据聚类结果寻找因素之间的关系。Wang等人(2024年)使用TextRank算法找到初始因素,然后结合相关文献和法律提取化学事故的影响因素。随后,他们使用基于α-水平集的模糊DEMATEL方法计算化学事故影响因素的性能水平。
在识别出事故因果因素后,需要进一步分析这些因素之间的传播关系。学者们在其他事故风险管理领域也进行了相关研究。例如,Jiao等人(2024年)基于边介数、平均路径长度和网络连通性设计了一个边脆弱性指数。该指数用于衡量破坏城市轨道交通网络中关键风险节点之间关系的影响。根据边脆弱性指数的大小和鲁棒性分析,提出了相应的应急救援策略。Qiu等人(2021年)根据关联规则的提升度,识别了各种煤矿事故因果网络中总提升度最高的事故路径。他们认为,一旦这些路径上的节点被触发,事故发生的可能性显著高于网络中的其他路径。
尽管现有研究取得了进展,但目前对化学事故因果关系的研究仍面临以下挑战:(1)由于依赖人工判断,存在较强的主观性,特别是对监管因素的系统分析不足;(2)大多数研究仅关注单一事故类型或特定场景,未能从多种事故类型中提取共同原因;(3)未能完全揭示因素之间的层次结构和非线性关系,难以描述事故链的复杂交互机制;(4)缺乏对关键因素影响的验证。
为了客观有效地预防化学事故,需要基于数据驱动的关键因果因素识别方法。本文通过提出一种综合方法来满足这一需求,该方法整合了文本挖掘、关联规则、复杂网络建模和灰关联分析(GRA)。我们的研究首先分析了中国106份化学事故调查报告。我们使用TextRank算法从这些报告中提取并识别关键风险因素。然后将这些因素分为六类:人为因素、环境因素、物体因素、管理因素、监管机构和灾害因素。为了确保识别出的因素集的可靠性和通用性,本研究将事故类型分布和因素系统与其他国家的事故调查报告结果进行了比较。其次,使用Apriori算法构建了一个基于关联规则的因果网络,其中提升度作为边权重,以揭示因素之间的关系。随后,创新性地引入了网络鲁棒性分析和GRA交叉验证机制来识别和验证关键节点。最后,根据关联规则的提升度,挖掘出最可能导致事故的风险传播路径。该方法为化学事故风险识别和预防提供了新的分析框架。研究结果为精确识别风险和系统控制化学事故提供了坚实的理论基础和实际参考。
本文的其余部分组织如下:第2章详细介绍了研究数据来源、所采用的各种方法的基本概念以及整体研究框架。第3章重点通过文本挖掘技术识别事故原因,挖掘它们之间的关联规则,并基于这些发现构建化学事故因果网络。第4章使用多种方法分析化学事故因果网络,揭示关键原因和关键因果路径。最后,第5章总结了本研究的结果。