地下水,作为地球上99%液态淡水的储存体,是维系农业灌溉、饮用水供应及生态系统健康的关键战略性资源。然而,在全球气候变化和人类活动加剧的背景下,地下水系统正面临地下水位持续下降、水质恶化及生态系统退化等一系列严峻挑战。在中国,广袤的国土上分布着复杂多样的水文地质单元,各地区地下水位的变化趋势及其背后的驱动机理存在显著差异,但长期以来,对其在全国尺度上的系统识别,尤其是自然因素与人为活动之间的非线性耦合作用,仍缺乏深入的理解。传统统计方法难以有效捕捉多因子间复杂的非线性关系与交互效应,而常规的机器学习模型则往往被视为“黑箱”,其决策过程难以解释。这导致我们在理解“是什么在驱动地下水位变化”以及“这些驱动因子如何相互作用”等核心科学问题时,仍面临巨大挑战。
针对上述问题,由郭宇静等人组成的研究团队在《Journal of Hydrology: Regional Studies》上发表了一项创新性研究。他们旨在系统揭示2005年至2016年间中国地下水位埋深(GLD)变化的时空格局,并定量解析其背后的驱动机制。研究团队构建了一个融合“空间异质性-非线性响应”的双维度分析框架,巧妙地将最优参数地理探测器与可解释机器学习方法相结合,以期更全面、更深入地理解中国地下水系统的动态变化。
为开展此项研究,作者主要运用了以下几项关键技术方法:首先,研究基于地形类型、水文地质结构和地下水类型将中国划分为五个水文地质区。其次,数据处理方面,采用了基于密度的噪声应用空间聚类(DBSCAN)算法对监测井时间序列数据进行异常值剔除,并使用Mann-Kendall趋势检验与Sen斜率估计器分析了GLD的时空变化趋势。在驱动因子分析的核心环节,研究建立了多源因子体系(涵盖气候、土壤、地形、植被、土地覆盖、水文过程及人类活动等12类因子),并运用方差膨胀因子和Boruta算法进行特征选择以消除多重共线性。随后,利用极端梯度提升(XGBoost)模型进行回归建模与预测,并采用SHapley可加性解释(SHAP)框架来量化各特征对模型预测的贡献,揭示其非线性影响及交互作用。同时,应用最优参数地理探测器(OPGD)量化各环境因子对GLD空间分异性的解释力并识别因子间的交互增强效应。最后,通过将SHAP与OPGD的结果进行交叉验证与整合,形成了对GLD驱动机制的双重验证与系统性阐释。
研究结果
1. 中国地下水位埋深的时空变化特征
研究利用Theil-Sen中值斜率和Mann-Kendall检验,将GLD变化趋势划分为显著退化、轻微退化、稳定、轻微改善和显著改善五类。分析发现,从全国尺度看,无论是潜水含水层还是承压含水层,其GLD变化均呈现出“退化多于改善”的总体格局,尤其是在黄淮海平原地区,退化现象最为严重。空间分布上,GLD呈现出“西深东浅”的格局,西部干旱区平均埋深最大,而松辽平原和南方地区埋深较浅。具体而言,潜水含水层中,黄淮海平原的净退化率最高,达53.9%;而南方地区则呈现出净改善趋势。承压含水层中,黄淮海平原的净退化率更是高达73.91%。
2. XGBoost模型构建与预测性能
研究为五大水文地质区分别构建了XGBoost预测模型。评估结果显示,所有模型在测试集上均表现出色,决定系数R2 均高于0.95,表明模型能够很好地捕捉GLD与驱动因子之间的复杂关系。其中,松辽平原区的模型预测误差最小,均方根误差仅为0.341米,而西部地区的预测误差相对较大,这可能与该地区地形复杂、气候条件严酷及观测数据稀疏有关。
3. 基于SHAP值的模型解释与驱动因子识别
SHAP分析清晰地量化了各驱动因子对GLD变化的贡献程度。结果表明,降水 、温度 和地下水开采量 是控制GLD变化的三个最关键因素,但其重要性排序存在区域差异。例如,在松辽平原和黄淮海平原,气候因子(降水和温度)的贡献最为突出;而在黄土高原和西部干旱区,地下水开采 则成为压倒性的主导驱动力。南方地区虽然降水丰沛,但地下水开采 仍然是影响GLD的最主要因素。SHAP依赖图进一步揭示了因子影响的非线性特征。例如,在黄淮海平原,当开采量处于中低水平时,其对GLD的驱动作用较弱;而当开采量超过一定阈值后,其影响急剧增强。
4. SHAP交互作用分析
研究进一步通过SHAP交互值深入探究了关键驱动因子之间的非线性耦合关系。例如,在松辽平原,地下水开采量与降水之间存在显著的交互效应:在低降水条件下,高强度开采会显著加剧地下水位的下降;而在高降水条件下,这种交互作用则趋于减弱。同样,开采量与潜在蒸散发、降水与温度之间的组合也显示出复杂的协同或拮抗效应。这表明,地下水系统的响应并非单个因子作用的简单叠加,而是多因子耦合驱动的结果。
5. 基于最优地理探测器(OPGD)的因子探测与交互探测
地理探测器的因子探测结果与SHAP分析具有高度的一致性,均识别出地下水开采 、降水 和温度 是关键驱动因子。此外,地理探测器的交互探测功能揭示了因子间存在的“双因子增强”或“非线性增强”效应。例如,在黄淮海平原,降水 与温度 的交互作用q值高达0.78,显著高于任一因子的独立贡献,表明气候因子间的协同作用极大地放大了对GLD空间分异的影响。在所有研究区域,地下水开采 与其他因子(如气候、地表径流)的交互作用普遍存在且强度很高,这从空间异质性的角度印证了人类活动与自然过程共同塑造地下水格局的复杂机制。
研究结论与讨论
本研究的核心结论在于,中国地下水位埋深的变化是自然气候因素与人类活动强烈耦合作用的结果。在全国尺度上,降水 、温度 和地下水开采量 构成了最核心的驱动三角。尤为重要的是,研究通过SHAP和地理探测器的互补印证,明确指出地下水系统的响应主要受多因子耦合效应驱动,而非任何单一因子 。SHAP进一步揭示了驱动因子间存在明显的非线性和阈值响应特征,例如开采量对GLD的影响存在临界值,气候因子之间的交互会改变彼此的作用强度与方向。
从区域差异来看,在气候较为湿润的东部平原(如松辽平原、黄淮海平原),气候因子 的波动是GLD年际变化的主要推手;而在水资源本就紧张的西部干旱区和黄土高原,人类开采 则上升为压倒性的主导因素。即便在降水丰富的南方地区,高强度开采 依然能成为局部区域GLD加深的主因,这凸显了人类活动对自然水文循环的深刻干预。
本研究的方法学意义重大。它成功构建并验证了一个将最优参数地理探测器 与可解释机器学习 相结合的双维度分析框架。地理探测器擅长从空间分异的角度量化因子的解释力及交互增强作用,而SHAP则能从模型预测的贡献度出发,揭示连续变量的非线性响应过程和潜在的阈值特性。两者结合,实现了从“空间格局”到“过程机制”的交叉验证与深度融合,为解析复杂环境系统(如水循环、生态系统响应)的驱动机制提供了一个更为稳健和普适的技术路径。
当然,研究也存在一些局限性,例如监测井空间分布不均、多源数据尺度不一致可能带来的不确定性,以及研究时段未能涵盖2016年后更严格的地下水管理政策的影响等。未来研究可通过融合多源遥感数据、进行多尺度敏感性分析、以及纳入政策变量来进一步完善。
总之,这项研究不仅深化了对中国乃至东亚地区地下水位变化机制的科学认识,更重要的是,其揭示的关键驱动因子及其交互机制,以及分区域的差异化主导因素,为在国家及区域尺度上制定“因地制宜、精准施策”的地下水可持续管理策略提供了至关重要的科学依据。在全球气候变化和用水需求持续增长的大背景下,这种基于数据驱动和机理解释的研究范式,对于实现水资源的长期安全与生态安全具有重要的指导价值。
打赏