利用增强型混合深度学习模型结合不确定性量化方法，对地下水储存异常进行时空预测与归因分析

时间：2026年2月2日

来源：Journal of Environmental Management

编辑推荐：

地下水储量异常预测中，本研究提出融合CNN-Attention-LSTM和Transformer-LSTM的混合深度学习模型，结合SHAP解释和SVGD不确定性量化方法，有效捕捉空间异质性和时间依赖性。在长江流域验证中，平均R²达0.90以上，气象因素贡献率最高（80.66%）。

作者：尹瑾娜 | 胡新瑶 | 南同超 | 陆春辉

中国江苏省南京市河海大学水灾防治国家重点实验室

摘要

大规模地下水预测本质上涉及具有强烈空间和时间异质性以及高维度特征的数据。传统的数据驱动方法往往难以有效捕捉复杂的非线性地下水动态，从而在准确性和可靠性方面面临巨大挑战。为了实现透明且可靠的预测，本研究提出了先进的混合深度学习建模方法，将这些方法整合到一个统一的框架中，包括地下水预测、归因分析和不确定性量化。构建了两种具有不同架构的混合模型，以有效捕捉空间模式和时间依赖性：CNN-Attention-LSTM（CAL）和Transformer-LSTM（TL）。通过Shapley Additive exPlanations方法解释了各组分的贡献。结合Stein Variational Gradient Descent（SVGD）来量化不确定性，并通过捕捉复杂的后验分布生成概率预测。该方法的有效性通过在中国长江流域的应用得到了充分证明。结果显示，CAL和TL模型均能准确描述该流域的时空异质性地下水存储异常（GWSA）分布，平均R²值超过0.90。在局部GWSA预测方面，CAL模型表现更优。气象因素对GWSA的贡献最大，在中下游流域占比达到80.66%。此外，特征之间的相互作用及其对GWSA的协同影响对特征范围非常敏感。SVGD显著提高了预测的可靠性，主要观测值均落在95%的置信区间内。该模型为准确预测GWSA和基于风险的决策提供了有希望的进展，同时提高了结果的可解释性。我们的方法具有广泛的应用性和可扩展性，可以灵活更新其他环境任务中的特征数据。

引言

地下水作为水循环的重要组成部分，对农业、工业、公共供水和生态系统保护至关重要（Griebler和Avramov，2015；Kuang等人，2024）。特别是在干旱期间，地下水为河流、湿地和湖泊提供基流（Irvine等人，2024；Xie等人，2024）。然而，由于气候变化和人类活动的影响，某些地区的地下水抽取量超过了补给量，导致区域性的地下水枯竭。这反过来引发了严重的生态和环境问题，如土壤盐碱化、地面沉降和水质下降（Hagage等人，2024；Yin和Tsai，2018）。因此，了解地下水存储的动态及其驱动机制对于可持续水资源管理至关重要，尤其是在气候变化、土地利用或人口快速变化的大规模地区。

量化地下水存储的变化需要密集的现场测量网络和对地下性质的全面理解（Pham和Tsai，2017）。然而，依赖传统的地下水监测数据来评估地下水存储仍然具有很大挑战性，因为维护观测井需要大量资源。这些井往往缺乏区域代表性，难以全面捕捉大规模地下水存储的变化（Condon等人，2021）。此外，在干旱或山区，观测井的稀缺性增加了从井数据中收集区域地下水存储变化的复杂性。作为替代方案，重力恢复与气候实验（GRACE）卫星任务通过测量地球重力场为监测陆地水存储（TWS）提供了前所未有的机会（Tapley等人，2004）。利用GRACE卫星数据和全球陆地数据同化系统（GLDAS），可以推导出区域和全球范围内的地下水存储异常（GWSA）（Long等人，2017）。然而，地下水存储数据表现出高度的空间和时间异质性，以及显著的尺度变化（Ramjeawon等人，2022）。一个更紧迫的问题是如何使用GRACE数据准确可靠地预测地下水存储变化，这对于地下水资源评估是必要的。

传统上，基于物理的数值模拟模型被用于地下水领域（Davamani等人，2024；Pham和Tsai，2017；Yao等人，2015）。然而，这些方法由于需要大量的数据、详细的地质异质性表征和密集的计算资源而面临巨大挑战。相比之下，机器学习（ML）和深度学习（DL）方法在地下水估算方面表现出色，因为它们在捕捉非线性映射方面具有强大能力，例如支持向量机（Asher等人，2015；Wang和Zha，2024；Wang等人，2024）、卷积神经网络（CNN）（Zounemat-Kermani等人，2021）。这些数据驱动的地下水预测模型在模拟历史地下水观测与外部驱动因素（如气象变量）之间的潜在关系方面展现出巨大潜力（Sarma和Singh，2022）。Wunsch等人（2021）比较了三种数据驱动模型在地下水水平预测方面的能力，发现如果训练数据有限，具有外生输入的浅层非线性自回归网络（NARX）通常优于其他深度学习技术。Peng等人（2025）评估了一个贝叶斯TimesNet模型在多种水文气候条件下的多步预测性能，发现其性能优于长短期记忆（LSTM）网络和Autoformer模型。GRACE为在全球水资源枯竭热点地区表征地下水存储异常铺平了道路，但在小尺度上的可行性仍是一个主要障碍。为此，采用随机森林模型从GRACE观测数据（分辨率50公里）模拟高分辨率（10公里）的地下水存储（Khorrami等人，2023）。开发了一个由随机森林（RF）、XGBoost和LightGBM组成的机器学习框架来降尺度GRACE衍生的GWSA，其中RF产生了最佳结果（Wu等人，2025）。此外，XGBoost还被用于重建高分辨率GWSA数据并识别影响地下水存储的关键水文气象因素（Shilengwe等人，2024）。尽管取得了有希望的结果，但这些模型在具有复杂水文地质特征的地区的表现可能不够理想。此外，输入数据的时间分辨率可能限制模型精确捕捉地下水存储变化的能力。这些局限性突显了持续改进和验证先进数据驱动建模方法以提高其预测能力和适用性的必要性。

地下水预测涉及具有强烈空间和时间异质性的数据（Taccari等人，2024；Yang等人，2025；Yin等人，2024），这对传统建模方法构成了重大挑战。为了解决这个问题，提高基于ML或DL的建模能力至关重要，这些模型需要有效捕捉空间模式和时间依赖性。这些模型需要考虑变量之间的非线性和动态相互作用，如气象因素、地表条件、人口密度和水文地质数据。除了提高准确性外，还存在两个主要障碍。首先，大多数研究依赖于使用单一模型，很少关注模型参数、结构和输入数据所带来的预测不确定性。这些不确定性往往导致不可靠的地下水预测（Roy等人，2025），这可能破坏复杂水资源管理和政策规划中的决策。单一模型可能无法充分捕捉底层系统的复杂和非线性关系（Tang等人，2020；Wang等人，2024）。因此，开发具有更强预测能力的混合模型或集成学习方法是必要的。其次，模型输出的归因分析经常被忽视，导致模型缺乏可解释性。识别驱动地下水存储变化的主要因素将提高模型的透明度和可信度。尽管一些研究提出了基于机器学习的方法来填补数据空白（Dharpure等人，2025；Wu等人，2025），但它们并未关注模型预测中的不确定性问题。将不确定性量化和解释分析整合到建模框架中，可以提供更可靠和透明的地下水预测，从而辅助地下水管理决策。

鉴于上述挑战，本研究旨在开发先进的基于DL的混合建模方法，将这些方法整合到一个统一的框架中，包括地下水预测、不确定性量化和归因分析。具体来说，构建并比较了两种具有不同架构的创新混合深度学习模型：CNN-Attention-LSTM和Transformer-LSTM。这两种基于注意力的模型都旨在利用各自组件的优势。CNN-Attention-LSTM通过CNN提取空间特征，并通过LSTM捕捉时间依赖性。注意力机制突出了重要特征，然后将其传递给LSTM层。作为对比，Transformer-LSTM利用Transformer的强大自注意力机制捕捉全局依赖性，同时利用LSTM处理时间序列的能力。通过在中国长江流域应用这两种模型来估计GWSA，证明了它们的有效性。该流域经历了多样的水文气候条件。与依赖传统的确定性预测不同，采用了基于Stein Variational Gradient Descent（SVGD）的算法来量化预测不确定性，通过近似其后验分布来实现。此外，Shapley Additive exPlanations（SHAP）方法通过分配重要性值来解释特征贡献，从而提高了开发模型的透明度和鲁棒性。这种混合建模框架具有高度适应性，可以灵活地应用于各种水文和环境任务。

研究区域

长江发源于青藏高原的唐古拉山脉，流经11个省份，最终在中国上海入海。河流从源头处的5400米高度降至吴松口的海平面。该流域面积约为180万平方公里，占中国总面积的20%（图1）。它被宜昌和虎口测量站划分为上游、中游和下游三个部分。

用于时空GWSA预测的混合深度学习模型开发

与单一模型相比，混合模型可以协同利用不同的深度学习架构，有效处理空间和时间信息。本研究开发了两种混合深度学习模型进行比较：CNN-Attention-LSTM（CAL）和Transformer-LSTM（TL）。它们的架构分别如图3所示。

混合深度学习模型的性能评估和比较

使用了2004年至2023年的229个月度数据，其中80%用于训练，20%用于测试。分别采用R²、MAE、RMSE和KGE四个指标来评估两种混合深度学习模型（CAL和TL）的预测性能。两种模型在测试数据上的性能分布分别展示在图5a1-5a4和图5b1-5b4中。这两种模型在长江流域的表现均良好，平均R²值