地下水作为水循环的重要组成部分,对农业、工业、公共供水和生态系统保护至关重要(Griebler和Avramov,2015;Kuang等人,2024)。特别是在干旱期间,地下水为河流、湿地和湖泊提供基流(Irvine等人,2024;Xie等人,2024)。然而,由于气候变化和人类活动的影响,某些地区的地下水抽取量超过了补给量,导致区域性的地下水枯竭。这反过来引发了严重的生态和环境问题,如土壤盐碱化、地面沉降和水质下降(Hagage等人,2024;Yin和Tsai,2018)。因此,了解地下水存储的动态及其驱动机制对于可持续水资源管理至关重要,尤其是在气候变化、土地利用或人口快速变化的大规模地区。
量化地下水存储的变化需要密集的现场测量网络和对地下性质的全面理解(Pham和Tsai,2017)。然而,依赖传统的地下水监测数据来评估地下水存储仍然具有很大挑战性,因为维护观测井需要大量资源。这些井往往缺乏区域代表性,难以全面捕捉大规模地下水存储的变化(Condon等人,2021)。此外,在干旱或山区,观测井的稀缺性增加了从井数据中收集区域地下水存储变化的复杂性。作为替代方案,重力恢复与气候实验(GRACE)卫星任务通过测量地球重力场为监测陆地水存储(TWS)提供了前所未有的机会(Tapley等人,2004)。利用GRACE卫星数据和全球陆地数据同化系统(GLDAS),可以推导出区域和全球范围内的地下水存储异常(GWSA)(Long等人,2017)。然而,地下水存储数据表现出高度的空间和时间异质性,以及显著的尺度变化(Ramjeawon等人,2022)。一个更紧迫的问题是如何使用GRACE数据准确可靠地预测地下水存储变化,这对于地下水资源评估是必要的。
传统上,基于物理的数值模拟模型被用于地下水领域(Davamani等人,2024;Pham和Tsai,2017;Yao等人,2015)。然而,这些方法由于需要大量的数据、详细的地质异质性表征和密集的计算资源而面临巨大挑战。相比之下,机器学习(ML)和深度学习(DL)方法在地下水估算方面表现出色,因为它们在捕捉非线性映射方面具有强大能力,例如支持向量机(Asher等人,2015;Wang和Zha,2024;Wang等人,2024)、卷积神经网络(CNN)(Zounemat-Kermani等人,2021)。这些数据驱动的地下水预测模型在模拟历史地下水观测与外部驱动因素(如气象变量)之间的潜在关系方面展现出巨大潜力(Sarma和Singh,2022)。Wunsch等人(2021)比较了三种数据驱动模型在地下水水平预测方面的能力,发现如果训练数据有限,具有外生输入的浅层非线性自回归网络(NARX)通常优于其他深度学习技术。Peng等人(2025)评估了一个贝叶斯TimesNet模型在多种水文气候条件下的多步预测性能,发现其性能优于长短期记忆(LSTM)网络和Autoformer模型。GRACE为在全球水资源枯竭热点地区表征地下水存储异常铺平了道路,但在小尺度上的可行性仍是一个主要障碍。为此,采用随机森林模型从GRACE观测数据(分辨率50公里)模拟高分辨率(10公里)的地下水存储(Khorrami等人,2023)。开发了一个由随机森林(RF)、XGBoost和LightGBM组成的机器学习框架来降尺度GRACE衍生的GWSA,其中RF产生了最佳结果(Wu等人,2025)。此外,XGBoost还被用于重建高分辨率GWSA数据并识别影响地下水存储的关键水文气象因素(Shilengwe等人,2024)。尽管取得了有希望的结果,但这些模型在具有复杂水文地质特征的地区的表现可能不够理想。此外,输入数据的时间分辨率可能限制模型精确捕捉地下水存储变化的能力。这些局限性突显了持续改进和验证先进数据驱动建模方法以提高其预测能力和适用性的必要性。
地下水预测涉及具有强烈空间和时间异质性的数据(Taccari等人,2024;Yang等人,2025;Yin等人,2024),这对传统建模方法构成了重大挑战。为了解决这个问题,提高基于ML或DL的建模能力至关重要,这些模型需要有效捕捉空间模式和时间依赖性。这些模型需要考虑变量之间的非线性和动态相互作用,如气象因素、地表条件、人口密度和水文地质数据。除了提高准确性外,还存在两个主要障碍。首先,大多数研究依赖于使用单一模型,很少关注模型参数、结构和输入数据所带来的预测不确定性。这些不确定性往往导致不可靠的地下水预测(Roy等人,2025),这可能破坏复杂水资源管理和政策规划中的决策。单一模型可能无法充分捕捉底层系统的复杂和非线性关系(Tang等人,2020;Wang等人,2024)。因此,开发具有更强预测能力的混合模型或集成学习方法是必要的。其次,模型输出的归因分析经常被忽视,导致模型缺乏可解释性。识别驱动地下水存储变化的主要因素将提高模型的透明度和可信度。尽管一些研究提出了基于机器学习的方法来填补数据空白(Dharpure等人,2025;Wu等人,2025),但它们并未关注模型预测中的不确定性问题。将不确定性量化和解释分析整合到建模框架中,可以提供更可靠和透明的地下水预测,从而辅助地下水管理决策。
鉴于上述挑战,本研究旨在开发先进的基于DL的混合建模方法,将这些方法整合到一个统一的框架中,包括地下水预测、不确定性量化和归因分析。具体来说,构建并比较了两种具有不同架构的创新混合深度学习模型:CNN-Attention-LSTM和Transformer-LSTM。这两种基于注意力的模型都旨在利用各自组件的优势。CNN-Attention-LSTM通过CNN提取空间特征,并通过LSTM捕捉时间依赖性。注意力机制突出了重要特征,然后将其传递给LSTM层。作为对比,Transformer-LSTM利用Transformer的强大自注意力机制捕捉全局依赖性,同时利用LSTM处理时间序列的能力。通过在中国长江流域应用这两种模型来估计GWSA,证明了它们的有效性。该流域经历了多样的水文气候条件。与依赖传统的确定性预测不同,采用了基于Stein Variational Gradient Descent(SVGD)的算法来量化预测不确定性,通过近似其后验分布来实现。此外,Shapley Additive exPlanations(SHAP)方法通过分配重要性值来解释特征贡献,从而提高了开发模型的透明度和鲁棒性。这种混合建模框架具有高度适应性,可以灵活地应用于各种水文和环境任务。