隧道掘进机(TBM)广泛应用于交通、采矿、市政和引水工程(Liu等人,2016年;Yu等人,2021b年;Yu等人,2023a年;Zhou等人,2022年;Qin等人,2023年;Zhang等人,2014年)。然而,TBM的性能受到围岩条件的极大影响(Yu等人,2023b年;Rostami,2016年)。此外,操作人员通常无法观察到隧道前方的情况,也无法直接获取围岩等级等信息,从而导致TBM施工中的不确定性和风险。精确感知地质条件是进行围岩稳定性分析、TBM掘进性能预测、灾害预警等重要任务的基础(Chen等人,2025b年;Wang等人,2017年;Yu等人,2021a年;Yu等人,2023b年;Yin等人,2024年;Xu等人,2025c年;Zhao等人,2025年;Wang等人,2021年;Huang,2017年;Hasanpour等人,2020年;Koizumi等人,2016年;Sissins和Paraskevopoulou,2021年)。因此,准确感知地质条件具有重要的工程价值。
TBM隧道地质条件识别方法大致可以根据数据来源分为四种类型:基于岩屑图像的方法(Gong等人,2021年;Dong等人,2025年;Yu等人,2026年)、基于前方地质勘探的方法(Li等人,2025b年;Chen等人,2023年;Liu等人,2024年)、基于振动信号的方法(Yang等人,2025c年;Tang等人,2025年;Nilot等人,2023年)以及基于掘进参数的方法(Huang等人,2025b年;Katuwal等人,2024年;Li等人,2023a年)。得益于人工智能技术的快速发展(Xia等人,2023a年;Xia等人,2023b年;Dong等人,2023年;Xu等人,2025a年;Xu等人,2025b年;Bigdeli等人,2021年;Karami等人,2021年;Naghsh等人,2021年;Shishegaran等人,2023年;Xia等人,2023c年;Wang等人,2024年;Yu等人,2025年;Qin等人,2024年;Huang等人,2025a年;Wang等人,2025年;Li等人,2025a年;Aghajari和Namin,2024年;Yin等人,2025年;Daniel等人,2025年;Zheng等人,2024年;Ma等人,2024年;Chen等人,2025a年;Du等人,2024年;Lian等人,2024a年;Lian等人,2024b年),越来越多的数据驱动方法被应用于地质条件的感知。尽管基于岩屑图像的方法受到了越来越多的关注,但其实时性能相对较差,因为从岩石被切割到岩屑被拍摄需要一定的时间。基于前方地质勘探的方法主要用于获取隧道前方较远距离内的不利地质信息。目前基于振动信号的研究较少,主要原因是在恶劣环境中获取振动信号具有挑战性。这三种方法在识别地质条件方面都存在局限性。因此,主流方法是基于TBM运行数据来感知地质条件。
基于掘进参数的方法主要包括基于机器学习的方法和基于深度学习的方法。Yu等人(2022年)提出了一种基于受限密集卷积自动编码器和深度神经网络的半监督方法,用于TBM隧道地质构造识别,该方法能够充分利用标记和未标记的数据。Man等人(2024年)提出了一个PCA-GRU模型用于围岩等级分类预测,将主成分分析(PCA)与门控循环单元(GRU)结合以提高模型的识别精度。Wu等人(2025年)提出了一种集成学习框架,将特征增强深度神经网络(E-DeepFM网络)与基础模型(如支持向量机和k最近邻)相结合,结果表明E-DeepFM网络的集成能够显著提升基础模型的性能。还有一些近期研究尝试将其他来源的数据纳入掘进数据中以进一步提高模型性能。Yang等人(2025b年)开发了一个特征融合框架,利用TBM掘进数据和切割头磨损数据来预测围岩等级,结果表明耦合模态融合策略能够显著提升随机森林和卷积神经网络模型的性能。深度学习方法通常比机器学习方法具有更高的精度;然而,它们在跨场景和跨项目应用中容易过拟合。同时,多源数据融合的建模方法对数据采集系统的可靠性要求更高。机器学习方法通常具有更好的泛化性能,应用前景良好。Yin等人(2022年)采用了五种集成学习方法构建围岩等级识别模型,结果表明LightGBM模型取得了最佳性能。Guo等人(2022年)使用随机森林算法建立了围岩等级分类模型,并确定了围岩的完整性和可挖掘性。Hu等人(2023年)基于PCA和随机森林算法建立了围岩参数预测模型,结果表明该模型能够准确预测石英含量、完整性系数、单轴饱和抗压强度(UCS)以及单位体积岩石中的节理数量。Yang等人(2025a年)使用经过灰狼优化、蛾火优化和贝叶斯优化的随机森林算法构建了三个混合模型来识别围岩等级,结果表明经过蛾火优化的模型表现最佳。然而,上述研究通常直接将掘进参数作为模型输入,而没有考虑掘进参数变化中蕴含的地质信息。同时,随机森林是最广泛使用的机器学习方法之一,但传统的随机森林算法在分类任务中为不同类别设置相同的权重,无法有效抑制由于不同类别样本之间的高相似性导致的误分类。
本研究提出了一种基于滑动窗口特征提取和权重自适应随机森林的TBM隧道围岩等级识别方法,该方法可以从掘进参数的变化中提取地质特征,并自适应调整不同类别的权重以提高模型性能。首先提出了一套数据预处理方法。其次提出了一种新的基于滑动窗口的特征提取方法。最后开发了一种新的权重自适应随机森林算法,能够自适应调整类别权重。本工作的主要贡献如下:
(i) 提出了一种基于滑动窗口特征提取和权重自适应随机森林的TBM隧道围岩等级识别方法。
(ii) 提出了一套数据预处理方法,包括基于随机森林的参数选择、基于孤立森林的异常值检测和基于传感器范围的数据归一化。
(iii) 开发了一种新的基于滑动窗口的特征提取方法,可以从掘进参数的变化中提取地质信息,并将模型性能提高12.1%,相比直接使用掘进参数作为输入。
(iv) 所提出的权重自适应随机森林算法能够自适应确定最优类别权重,以抑制由于不同类别样本之间高相似性导致的误分类,其准确率分别比随机森林、AdaBoost、XGBoost和LightGBM高出1.9%、4.9%、4.3%和3.0%。
本文的其余部分安排如下:第2节介绍项目并分析收集的数据。第3节介绍特征提取方法和权重自适应随机森林算法。第4节验证了所提方法的有效性和优越性。第5节给出结论。