气候变化显著改变了全球降水趋势(Frich等人,2002;Trenberth,2011),对地表径流和极端洪水事件的发生频率产生了重大影响(Barnett等人,2008;Ji等人,2015;Kundzewicz等人,2014;Peterson等人,2013)。洪水是与气候变化相关的最普遍的自然灾害之一,影响了全球超过三分之一的陆地面积(Syldon等人,2024)。这些事件影响了全球约82%的人口(Perera等人,2015),并对农业、城市基础设施和生态系统构成了重大挑战(Piao等人,2010;Skogen等人,2018)。自1900年以来,洪水已导致约七百万人死亡(Chen等人,2021;Chen等人,2021b;Lai等人,2020;Zheng等人,2024),2021年 alone 的全球经济损失就超过了700亿美元(Bevere和Remondi,2022;Endendijk等人,2024)。沿海地区居住着超过27.5亿人(Reimann等人,2023),面临极端降水、热带气旋和海平面上升的严重风险(Buzard等人,2024;Hasan Tanim和Goharian,2021;Li等人,2023)。因此,深入分析地表径流的长期趋势及其背后的机制对于预测未来的水文行为和制定有效的水资源管理及洪水缓解策略至关重要(Hu等人,2012)。
珠江是中国第二大河流,按年流量计算在全球排名第13位(Zhang等人,2009)。珠江流域(PRB)的径流变化显著影响了区域生态系统(Howard和Howard,2016)、沉积物输送以及三角洲的形态(Li等人,2011)。PRB的水资源在空间和时间上表现出显著的变化性,降水的季节性和空间性波动经常导致洪水和干旱的发生(Gu等人,2017)。研究表明,自20世纪50年代以来,PRB极端降雨事件的发生频率呈上升趋势(Zhang等人,2011;Zolina等人,2010),这加剧了洪水的严重性(Zhang等人,2015)。然而,大多数研究仅关注趋势和相关性分析,对径流和洪水驱动因素的定量归因仍然有限,尤其是在子流域和事件尺度上。以往的研究强调了气象和水文变化的时空趋势及其对地表径流的综合影响(Chen等人,2019;Wu等人,2019;Wu等人,2023b)。其中,降水变化通常被认为是主要控制因素(Zhu等人,2019)。这一差距凸显了进行定量、时间分辨的驱动因素归因的必要性,以明确洪水生成机制并改进灾害预防措施。
现有的地表径流分析方法大致可以分为两种不同的途径。第一种方法基于数据进行分析,包括相关性研究,旨在评估气候变化和景观变化对径流和沉积物输送的影响(Liang等人,2023;Liu等人,2020;Wu等人,2023b;Zhou等人,2019)。第二种方法利用基于过程的模型或水量平衡原理来定义环境变化与径流之间的联系,从而推断影响径流变化的机制(Du等人,2015;Li等人,2011)。
这两种方法在同时有效拟合数据和处理变量之间的非线性关系方面都遇到了困难。此外,目前关于PRB径流机制的研究往往采用分离的方法,未能全面分析气象、水文和地貌因素之间的相互作用。对PRB洪水事件的特征和驱动因素进行综合分析对于阐明不同自然条件下的水文气象因素与地表径流之间的相互作用至关重要(Xu等人,2024)。这些见解将为有效的灾害缓解和水资源管理奠定坚实的科学基础(Zhang等人,2023)。
机器学习的最新发展使得深度学习方法能够有效地对非平稳时间序列进行建模和预测(Brunner等人,2021;Kumar等人,2023)。深度学习在从数据中提取抽象特征方面非常有效,通常优于传统的回归技术,并克服了其根本局限性(Jimeno-Sáez等人,2018;Kratzert等人,2019)。通过与数据的完全整合,这些模型能够揭示输入和输出之间的隐含关系。长短期记忆(LSTM)网络在模拟动态水文变量方面表现出出色的能力(Jiang等人,2022),并常用于降雨和洪水模拟(Zhao等人,2024)。与人工神经网络(ANN)和支持向量机(SVM)等技术相比,LSTM在捕捉时间序列数据中的长期依赖性方面具有更强的能力(Hu等人,2018;Kang等人,2020)。双向LSTM(BiLSTM)(Schuster和Paliwal,1997)架构结合了前向和后向LSTM层,从而提高了模型捕捉过去和未来数据中依赖性的能力。最近,结合CNN(LeCun等人,1998)和BiLSTM进行特征提取的架构在降雨和径流预测领域受到了关注(Deng等人,2022;Hu等人,2023;Wu等人,2023a;Zhang等人,2024)。尽管取得了这些进展,深度学习模型的“黑箱”特性仍限制了其透明度,尤其是在科学背景下(Ilyas等人,2019)。为了提高模型的透明度和可信度,已经开发了可解释人工智能(XAI)技术(Wang等人,2023)。如SHapley加性解释(SHAP)、部分依赖图(PDP)和局部可解释模型不可知解释(LIME)等技术在阐明复杂机器学习模型的机制方面发挥了重要作用。
本研究旨在探讨PRB地表径流的驱动机制和主要影响因素。我们从各个子流域收集了高分辨率的数据集,包括降水、温度、土壤湿度、蒸发、风速和上游径流,以开发用于训练CNN–BiLSTM–ATT模型的时间序列数据。该模型结合了CNN、BiLSTM和注意力机制,有效捕捉了复杂的非线性关系,并改进了极端径流的模拟。此外,还使用SHAP来评估模型的可解释性,并测量不同气象和水文因素对不同子流域地表径流的相对影响。在这个背景下,我们将问题定义为水文检测和归因任务,并开发了一个数据驱动的框架,用于检测地表径流的变化,并将其归因于PRB子流域中的各个气象和水文驱动因素。因此,本研究扩展了深度学习与XAI结合在水文归因方面的最新应用。在此框架内,进行了消融实验,以量化在CNN–BiLSTM架构中嵌入多头注意力模块的增量效果。还使用RMSE_HF对高流量日进行了额外评估。基于这些进展,本研究为流域尺度的水文过程提供了新的见解,并为洪水缓解和水资源管理提供了实证支持。