基于地球物理数据预测地下介质的岩性分布对于水库预测、地热资源开发和二氧化碳封存具有重要意义(Hussain等人,2024;Okoroafor等人,2022;Wang等人,2020;Xie等人,2018;Yang等人,2025a;Yang等人,2025b)。机器学习(ML)能够发现地球物理数据与岩性之间的非线性关系,为岩性预测提供了一种智能且有效的方法(Bergen等人,2019;Gholami等人,2014;Kumar等人,2022;Fan等人,2024)。我们的主要目标是建立一个结合井测井数据和地震反演结果的ML驱动工作流程来进行岩性预测。
根据是否需要标签,机器学习可以分为监督学习和无监督学习(Geurts等人,2006)。无监督学习可以发现未标记数据中的内在关系。常见的无监督学习算法包括K-means聚类(Troccoli等人,2022;Weatherill和Burton,2009;Fan等人,2026)、主成分分析(Roden等人,2015;Wu和Bai,2018)以及核密度估计。而监督学习则需要预定义的标签(Shuvo和Joy,2024)。它涉及使用特征数据和标记数据训练模型,然后根据评估结果选择最优参数或模型以准确预测目标参数(Li等人,2024;Mou等人,2022)。常见的监督学习方法包括梯度提升决策树(GBDT)(Al-Mudhafar等人,2022;Zhou等人,2020)、K最近邻(Lee等人,2019)和集成方法(Zhao等人,2023)。监督学习可以进一步分为分类和回归,前者提供离散输出结果,后者提供连续输出结果(Osisanwo等人,2017;Rokach,2016;Duan等人,2026)。
在石油地球物理学中,已经应用了多种ML方法来进行地质解释任务。预测地震相(Zhou等人,2025)、岩相(Babu等人,2022)和成岩相(Zhu等人,2025)等地质属性本质上是一个分类问题,而预测包括弹性属性和岩石物理参数在内的水库参数则构成一个回归任务(Wang等人,2026;Kumar等人,2025;Zou等人,2021)。由于石油地球物理学的应用必须保持地质意义并符合地球物理原理,因此最常采用监督学习或半监督学习方法。为了获得更可靠的岩性预测,本研究采用了一种改进的监督梯度提升分类方法。传统上,岩性预测主要依赖于井测井数据(Zhao等人,2021)。然而,随着勘探目标的日益复杂,预测岩相的3D空间分布变得至关重要。因此,本研究首先使用井测井数据训练ML模型,然后整合3D地震反演结果来预测岩性的3D空间分布。这种工作流程为地下地质异常特征描述和井位优化提供了强有力的数据支持。
GBDT算法是一种强大的机器学习方法,能够高效处理分类和回归问题(Dev和Eden,2019;Liang等人,2020)。为了提高GBDT算法的计算效率并降低参数优化难度,近年来开发了多种GBDT算法。LightGBM提高了ML模型的训练速度并降低了内存消耗(Demir和Sahin,2023)。Extreme Gradient Boosting(XGBoost)增强了GBDT的并行计算能力,使其适用于大规模数据集的预测(Wang等人,2023a)。这些算法在岩性预测(Dong等人,2016;Gu等人,2020;Kim,2022;Zhao等人,2021)、地震相预测(Dunham等人,2020;Liu等人,2020)和水库参数预测(Pan等人,2022;Talib等人,2022;Wu等人,2023)等领域得到了广泛应用。
本文的结构如下。首先,我们介绍了研究区域的地质背景。然后,我们描述了基于井测井数据和地震反演结果的LightGBM预测工作流程。我们重点解释了LightGBM的算法原理以及所使用的数据和特征选择过程。接下来,我们展示了在研究区域的应用结果。此外,我们还讨论了LightGBM与其他梯度提升方法之间的预测性能比较。