岩相识别是红星地区页岩油气储层精细表征的核心步骤。然而,针对该地区目前存在的岩相标注样本稀缺及常规测井响应特征重叠的识别痛点,传统常规识别方法的精度不足。卷积神经网络(Convolutional Neural Network, CNN)和长短期记忆网络(Long Short-Term Memory, LSTM)等深度学习模型因其严重依赖大规模高质量标注样本,也无法适应红星地区现有的数据条件。研究人员建立了基于矿物成分和总有机碳(Total Organic Carbon, TOC)含量的三端元—四组分岩相划分方案,将红星地区吴二段(Wu-2 Member)页岩划分为富碳混合型、富碳硅质型、高碳混合型、高碳硅质型及中碳灰质型五类岩相。通过整合贝叶斯(Bayesian)分类的小样本学习能力、反向传播(Backpropagation, BP)神经网络的非线性拟合优势及随机森林(Random Forest)的抗噪稳定性,构建了异质集成学习模型。利用研究区HY1-4井982组岩心标定测井样本进行训练与验证。实验结果表明,该模型在验证集上的整体识别准确率达88.81%,显著高于贝叶斯分类(66.78%)、BP神经网络(85.08%)和随机森林(83.05%)。在训练样本缩减至10%及测井数据加入标准差0.3的高斯噪声等不利条件下,模型仍保持80%以上的识别准确率,并在福临(Fuxing)地区的跨区域验证中表现出初步适应性。本研究证实,异质集成学习模型在红星地区页岩岩相识别中具有比常用方法更高的精度和工况适应性,可为华南类似早期探区的页岩储层岩相识别提供工程技术参考。
论文解读:红星地区页岩岩相智能识别的异质集成学习方法研究
该研究针对四川盆地东缘红星地区二叠系吴家坪组二段(Wu-2 Member)页岩气早期勘探阶段面临的岩相标注样本少、测井数据含噪及不同岩相测井响应重叠等问题,传统的薄片鉴定与常规测井分析方法精度不足,而依赖大样本的深度学习(CNN、LSTM)模型难以适用。为此,研究人员基于矿物三端元(硅质、黏土、碳酸盐矿物)结合总有机碳(Total Organic Carbon, TOC)含量,建立了"三端元—四组分"岩相分类方案,并采集HY1-4井982组岩心刻度测井数据,筛选了TOC、声波时差(AC)、补偿中子(CNL)、体积密度(DEN)、自然伽马(GR)、无铀伽马(KTH)、铀(U)、泊松比(POIS)、杨氏模量(YMOD)及波阻抗等13条敏感曲线作为输入特征。研究人员构建了融合贝叶斯(Bayesian)分类器、反向传播(Backpropagation, BP)神经网络和随机森林(Random Forest)的异质集成学习(Heterogeneous Ensemble Learning)模型,通过K折交叉验证与梯度下降算法优化基学习器的权重矩阵(W)与偏置向量(b),采用SoftMax归一化及交叉熵损失函数(Cross-Entropy Loss)进行二次训练,并将结果与单一模型进行对照实验(样本缩减至10%、加入标准差σ=0.1~0.3的高斯噪声)及跨区(福临地区FY1井)验证。研究得出结论:该异质集成模型在标准及复杂工况下均优于单一算法,验证集准确率达88.81%,且在极少量样本与强噪声干扰下保持>80%准确率,具备良好的泛化能力,为南方类似探区页岩储层评价提供了技术借鉴。论文发表于《Results in Engineering》。
主要关键技术方法:
研究人员以红星地区HY1-4井吴二段(Wu-2 Member) 982组岩心标定测井样本为数据集,按7:3划分为训练集与独立验证集,对13维测井敏感特征进行Min-Max标准化至[0,1]。建立基于硅质矿物(石英+钾长石+斜长石≥50%)、黏土矿物(伊利石≥50%)、碳酸盐矿物(方解石+白云石≥50%)及混合页岩的三元矿物分类,叠加TOC四级划分(TOC≤2%低有机、2%< />< />-9)、双层BP神经网络(隐层节点20,10;激活函数ReLU;优化器Adam;学习率0.01)及随机森林(n_estimators=100, max_depth=10, criterion=gini)。异质集成层将三个基学习器输出的5类概率值(共15维)进行线性组合Z=XT•W+b后经SoftMax得到最终预测类别,利用K-fold交叉验证计算交叉熵损失并通过梯度下降迭代更新W与b至收敛。
研究结果:
2.1. Geological Classification Methods of Lithofacies
研究人员通过岩心测试确定Wu-2段页岩主要由硅质、黏土及钙质矿物组成,TOC与孔隙度、含气量呈显著正相关(r=0.78, 0.82),TOC≥4%界定为有效储层岩相阈值。据此制定三端元—四组分分类标准,将页岩划分为富碳混合、富碳硅质、高碳混合、高碳硅质及中碳灰质页岩五类,测井响应分析显示有机质含量与物性及放射性正相关,硅质矿物含量与声阻抗正相关,为机器学习识别提供地球物理依据。
2.2. Machine learning methods for lithology classification
深度学习方法(CNN、LSTM、Transformer)虽具特征提取优势但需大量标注样本且"黑箱"难解释,不适用于本区。传统模式识别方法中,贝叶斯分类小样本适应性强但抗噪差;BP神经网络非线性拟合能力强但样本量少(降至10%)时过拟合严重(准确率降至46.61%)且参数敏感;随机森林抗噪性好但复杂非线性关系捕捉能力弱于优化后的BP网络。基于此,研究人员设计异质集成模型实现三者优势互补。
2.2.2. Design of Heterogeneous Ensemble Learning Methods
模型采用K-fold交叉验证避免过拟合,每折中用K-1子集训练三个基学习器,剩余子集预测产生概率矩阵,经线性组合与SoftMax归一化后比对真实标签计算交叉熵损失,利用梯度下降调整权重W与偏置b直至误差收敛,输出最优集成参数下的岩相概率预测。
4.1. Analysis of Experimental Results from Bayesian Classification
贝叶斯分类验证集准确率66.78%,平滑参数var_smoothing在1e-9~1e-7间波动对结果影响极小(<0.01%),表明低参数敏感性。样本减至10%时准确率仍>66%,具优良小样本学习能力;但加噪σ≥0.2时准确率降幅>10%,抗噪能力弱。
4.2. Analysis of Experimental Results from the BP Neural Network
BP网络最优结构(20,10)下达85.08%准确率,但结构变化引起大幅波动(51.36%~85.08%),参数敏感。样本减至10%时骤降至46.61%(过拟合);加噪实验中σ=0.3时仍保持77.47%,具较好抗噪非线性映射能力。
4.3. Analysis of the Random Forest Results
随机森林最佳配置(n_estimators=100, max_depth=10)下验证准确率83.05%~83.15%。样本减至10%时降至64.75%,优于BP但不及贝叶斯;加噪σ=0.3时仍达80.03%,抗噪性最强,但因单树结构简单限制了对复杂非线性岩性关系的拟合上限。
4.4. Analysis of the Heterogeneous Ensemble Learning Model
异质集成模型在标准验证集上准确率达88.81%(RF=10棵树,BP结构(20,10)),较贝叶斯、BP、RF分别提升22.03%、3.73%、5.76%。样本减至10%时保持81.36%,加噪σ=0.3时保持82.20%,全面优于单一模型。跨区验证(福临地区FY1井,仅用9条常规曲线及矿物分类)结果显示模型能适应不同区域地质—测井差异,具良好推广性。
讨论与结论翻译:
本研究针对红星地区二叠系Wu-2段薄互层页岩储层岩相识别精度低及复杂数据条件适应性差的关键技术难题,基于矿物成分与有机质丰度建立了科学的三端元—四组分岩相分类方案,构建了融合贝叶斯分类、BP神经网络与随机森林的异质集成学习模型用于智能岩相识别。通过系统的模型训练、对比实验与跨区域验证,明确了研究区岩相划分特征及所提模型的性能优势,为红星地区及周边页岩岩相识别与有利储层预测提供了可靠的技术方法与理论支撑。主要结论如下:(1)红星地区Wu-2段页岩储层以硅质页岩与混合页岩为主,少量灰质页岩,TOC呈高—富碳分布,TOC与孔隙度及含气量显著正相关(r分别为0.78与0.82),TOC≥4%为有效储层岩相临界值;基于矿物三元分类与TOC四级划分可将Wu-2段页岩精确划分为富碳混合型、富碳硅质型、高碳混合型、高碳硅质型及中碳灰质型五类岩相,不同岩相测井响应分化明显。(2)三种传统模式识别模型在红星地区岩相识别中表现各异:贝叶斯分类参数不敏感、小样本适应性强(样本减至10%准确率仍>66%),但抗噪差(σ=0.2噪声下降>10%),验证准确率66.78%;BP神经网络非线性拟合强(理想条件下达85.08%)且抗噪较好(加噪后仍>77%),但严重依赖样本量与网络结构,样本减至10%时过拟导致骤降至46.61%;随机森林抗噪好且具中等小样本适应性(加噪各水平>80%,样本10%时64.75%),验证准确率83.15%,但单树结构限制其对复杂非线性岩性关系的捕捉能力。(3)融合三者优势的异质集成学习模型显著解决了单一模型应用痛点:通过K折交叉验证与梯度下降优化基学习器权值与偏置实现优势互补——继承贝叶斯强小样本学习能力、BP强非线性拟合能力及随机森林优抗噪与异常值容忍度。标准验证集整体识别准确率88.81%,较贝叶斯、BP、随机森林分别提高22.03%、3.73%与5.66%;不利条件下训练样本减至10%时准确率81.36%,测井数据加噪σ=0.3时82.20%,远优于单一模型,展现对研究区复杂数据条件的强适应性。(4)异质集成模型具良好跨区域泛化性与工程应用价值:福临地区交叉验证表明模型在不同岩相分类标准与测井特征组合下仍能获满意识别结果,可适应四川盆地不同区域地质—测井差异。(5)后续研究将扩充红星地区多井岩心—测井样本弥补单井空间局限性;融入薄层储层页岩岩相纵向连续性特征优化模型以提升垂向精细识别能力;引入数据增强与类别不平衡处理技术;探索异质集成与深度学习(CNN、LSTM)结合以挖掘测井深层特征信息,实现复杂构造区页岩岩相高精度识别。