一种混合实证与概念模型,用于在水文模型中改进数据有限情况下水库的表示效果

时间:2026年5月18日
来源:Water Resources Research

编辑推荐:

摘要 大量的水坝和水库从根本上改变了河流流量模式和陆地水文状况。然而,由于对实际运行复杂性的理解有限以及缺乏长期现场运行数据,大规模水文模型仍然依赖于简化的、往往不切实际的水库运行方案。在通用数据驱动的水库运行模型(GDROM)的基础上,本研究引入了C+GDROM,这是一种结合

广告
   X   

摘要

大量的水坝和水库从根本上改变了河流流量模式和陆地水文状况。然而,由于对实际运行复杂性的理解有限以及缺乏长期现场运行数据,大规模水文模型仍然依赖于简化的、往往不切实际的水库运行方案。在通用数据驱动的水库运行模型(GDROM)的基础上,本研究引入了C+GDROM,这是一种结合了经验性和概念性的水库运行模型,旨在减少数据需求的同时提高与水文模型的兼容性。C+GDROM保留了GDROM的模块化结构,每个模块代表在特定条件下的某种运行动作(例如洪水或干旱),并使用综合的实际运行经验和从历史观测或遥感存储数据中得出的概念性存储调节曲线来明确定义模块公式及其转换条件,这有助于保持物理上一致的存储动态并指导释放决策。C+GDROM提出了一个通用模型和两个针对特定运行目的的变体:洪水控制模型和灌溉模型,并在美国256个水库上进行了评估。结果表明,在数据稀缺的情况下(没有现场数据,使用默认规则参数),C+GDROM通用模型在日常释放和存储模拟方面的表现显著优于现有的概念性水库模型;而使用有限现场数据(2年数据)进行校准后,这两种特定目的模型的性能进一步提高。性能的提升和数据需求的减少得益于GDROM通用模块类型和概念性存储调节曲线的通用性。这些结果表明,C+GDROM作为一种对现场数据依赖性较低的水库运行表示方法,在水文模型中具有潜力。

1 引言

全球范围内建造和运营了大量的水坝和水库,用于洪水控制、灌溉、供水和水力发电等目的,这些活动从根本上改变了河流流量模式和陆地水文状况(Haddeland等人,2014;Kåresdotter等人,2022;Poff等人,1997)。然而,由于对实际水库运行复杂性的理解有限(Li等人,2024)以及运行数据的难以获取(Steyaert & Condon,2024),大规模水文模型(LSHMs)仍然依赖于简化的、往往不切实际的水库运行方案(例如Döll等人,2003;Hanasaki等人,2008;Shen等人,2025;Wisser等人,2010;Wu & Chen,2012;Zajac等人,2017)。这可能导致模型参数化存在偏差,并扭曲水文过程和大陆到全球的水循环模拟(Dang等人,2020;Hejazi等人,2008;Pokhrel等人,2016;Vora等人,2024)。因此,改进这些模型中的水库运行表示对于提高水文模拟的准确性以及支持水资源规划和管理至关重要。然而,由于水库运行数据的稀缺,进展受到限制——许多水库只有短期记录或不完整的数据集。为了在LSHMs中表示水库运行,已经进行了长期建模工作。这些模型可以大致分为概念性模型和数据驱动模型。概念性模型——如自然湖泊方法(Coe,2000;Döll等人,2003;Meigh等人,1999)、基于流入和需求的方法(Hanasaki等人,2008;Wisser等人,2010)以及基于目标存储和释放的方法(Burek等人,2013;Dong等人,2022;Shen等人,2025;Wu & Chen,2012;Zajac等人,2017)——是透明的,并适用于数据有限的水库。因此,许多这些概念性水库模型已经被整合到LSHMs中(Burek等人,2013;Döll等人,2009;Droppers等人,2020;Fekete等人,2010;Wisser等人,2010)。然而,这些模型受到简化或过度简化的运行规则的约束;此外,一些概念性模型依赖于灌溉和其他水需求数据来进行模型校准(例如Dong等人,2022;Hanasaki等人,2008),而这些数据往往不可用。相比之下,数据驱动模型或一般意义上的经验模型直接从历史记录(流入、释放和存储)中提取实际运行行为,这可能揭示了规定的运行规则和操作者在应对极端事件时的经验和理由(Zhao & Cai,2020)。已经应用了多种机器学习技术来模拟单个水库的运行(例如Coerver等人,2018;Longyang & Zeng,2023;Yang等人,2021;Yu等人,2025)。尽管这些模型通常能够提高模拟准确性,但大多数数据驱动模型依赖于黑盒机器学习算法,并需要长期的现场特定运行记录来进行模型训练。最近的研究致力于开发更透明和通用的数据驱动模型,如DZTR(Yassin等人,2019)、ISTARF(Turner等人,2021)和通用数据驱动的水库运行模型(GDROM)(Chen等人,2022)。然而,这些模型仍然依赖于大量的历史运行数据来进行模型训练或参数校准,这限制了它们对数据稀少甚至没有数据的水库的适用性。因此,仍然需要一种新的水库模型,能够以可解释的形式更好地表示实际运行行为,并适用于数据有限的水库。本研究开发了一种结合了经验性和概念性的水库运行模型C+GDROM,旨在数据有限的情况下用于水文模型中的水库表示。C+GDROM基于概念性存储调节曲线和GDROM(Chen等人,2022)构建。GDROM使用基于多年运行数据训练的模块化决策树结构来反映实际的“如果-那么”调节逻辑,每个模块代表在特定条件下的某种运行动作(例如干旱、洪水)。Li等人(2024)进一步分析了来自美国本土450多个数据丰富的水库的GDROM派生模块,确定了五种通用模块类型和关键的模块转换驱动因素,展示了将这些模块作为“乐高”积木用于灵活水库建模的潜力,并为将GDROM扩展到数据有限的水库提供了线索。在本研究中,我们提出了C+GDROM,这是一种混合建模框架,其中模块类型和转换条件基于对实际运行模式的综合理解来明确指定。C+GDROM通过概念性存储曲线和物理上有意义的模块参数化提高了可解释性,有助于减少与不完整或噪声数据相关的建模不确定性。作为回报,C+GDROM可以应用于数据有限的水库,同时其简单和通用的公式保持了与LSHMs的高兼容性。C+GDROM的性能在美国256个水库上进行了评估(每个水库都有超过25年的运行数据)(Chen & Cai,2025)。

2 方法论

图1展示了C+GDROM建模框架。为了为特定水库开发C+GDROM,模型准备阶段首先基于历史观测或遥感存储数据构建概念性存储调节曲线,这提供了一些关键的存储曲线参数。还需要基本的水库特征(包括容量、主要功能和大小比例)和流入统计信息(例如平均值、分位数)来进行模型选择和参数确定。如果可用,可以使用2年或更长时间的现场运行数据(包括每日流入、释放和存储)来校准每个释放模块的参数,以提高性能;否则,将提供基于数据丰富的水库运行数据得出的统计关系的默认模块参数。C+GDROM旨在与水文模型集成,它接收每日流入作为输入,并将水库释放作为改变后的河流流量用于下游水文建模。每日水库存储可以是一个外部输入变量,也可以根据水量平衡方程内部确定。图1展示了C+GDROM建模框架的概览。接下来,我们首先介绍从GDROM派生的概念性存储调节曲线和经验知识,以构建C+GDROM。然后,我们详细介绍了适用于不同条件的C+GDROM框架的设计。最后,我们介绍了用于比较的基准模型,并描述了模型评估的数据来源和实验设计。

2.1 C+GDROM的概念性和经验性组成部分

2.1.1 概念性存储调节曲线

实际的水库运行受到预定义的存储调节曲线(也称为规则曲线)的指导,该曲线定义了每年每天的水资源保护区的上限(也作为预留的洪水控制区的下限)。同时,水库通常遵循相对稳定的释放计划以满足灌溉、市政和工业供水等需求。这些运行约束导致水库在一年中的不同时间达到特征性的存储水平。对于以洪水控制为主的水库,在非洪水条件下,存储通常保持在洪水限制水位(FLWL,即洪水控制区的底部)附近,在洪水事件期间临时存储超过FLWL以减弱下游洪水,并在之后逐渐减少存储。Cecil M. Harden Lake(图2a)的行为说明了这一点,其中多年中位数存储紧密跟随FLWLs,反映了其特征性运行水平。相比之下,主要用于灌溉、市政和工业供水或水力发电的水库,在低流量期间依赖储存的水资源,因此不能始终将存储保持在规则曲线定义的水平附近。尽管如此,补充和减少存储的时间以及存储界限相对一致,尽管由于流入变化引入了一些年际存储差异,但仍产生了特征性的存储变化模式,如Rimrock Lake(以灌溉为主,图2b)所示。图2展示了(a)印第安纳州Cecil M. Harden Lake(1990–2017年)和(b)华盛顿州Rimrock Lake(1990–2019年)的历史每日存储水平和概念性存储调节曲线。每条灰色曲线代表单年的观测存储轨迹,红色曲线代表历史每日存储水平的中位数。蓝色曲线表示概念性存储调节曲线,其中A1–A4表示不同存储阶段之间的转换时间; 和 定义了两个转换阶段期间的存储值。最近的研究使用历史中位数存储值作为目标或特征存储水平来改进水库建模。例如,Dong等人(2023)应用了多年中位数的10天滚动平均值作为每日目标;Shen等人(2025)使用历史月度中位数作为月度目标。这些方法可以平滑短期变化并保持非线性存储动态。然而,它们通常需要存储大量参数(例如365个每日值或12个月度值),这可能导致物理解释困难并限制其可转移性。此外,由于现场数据的有限可用性,存储信息通常来自水深和遥感(RS)水面数据,这些数据受到时间间隔和测量不确定性的影响。在这种情况下,使用原始或基于移动平均的历史中位数作为存储目标可能会对水库建模引入不可忽视的偏差(如支持信息S1中的图S1所示)。为了解决这些限制,本研究使用从历史中位数派生的概念性存储调节曲线来表示典型的存储动态,该曲线由六个参数定义。与操作手册中定义的实际规则曲线不同,概念性曲线反映了由规定的保护区边界、平均流入和释放决策规则塑造的典型存储。之前的工作提出了基于余弦函数的概念性目标存储曲线(Shu等人,2023)。然而,余弦函数的内在对称性可能限制了其表示现实世界中多样且往往不对称的存储动态的能力。在这里,我们采用了由六个参数定义的分段线性公式,允许灵活的持续时间和斜率。这种公式提供了对主导季节性存储模式的平滑和稳健的近似,同时保持了清晰的操作解释,并允许在大规模建模环境中进行灵活调整。在提出的概念性存储调节曲线中,四个时间参数(A1–A4,定义为月份)划定了关键阶段之间的转换:增加存储、减少存储以及两个相对稳定的存储水平的过渡阶段。每个阶段至少持续1个月,以保持季节性的真实性。另外两个参数 和 指定了转换阶段A4到A1和A2到A3的代表性存储水平。为了确定这些参数,在A1 < A2 ≤ A3 < A4(或A4 ≤ A1 < A2 ≤ A3)的规格下,A1–A4在1月至12月之间进行采样,相应的 和 分别计算为A4-A1和A2-A3月份的中位数存储值。参数集是通过最小化概念性和历史中位数存储曲线之间的差异来确定的。如图2a和2b所示,这种方法有效地捕捉了Cecil M. Harden Lake和Rimrock Lake的季节性存储变化模式。一旦确定了这六个参数,就可以通过四个线性部分之一进行线性插值获得每日典型存储水平。如果 和 之间的相对差异小于10%,则认为季节性变化可以忽略不计,此时使用一个常数 。水库大小比例是水库建模中广泛使用的属性,最初定义为水库存储容量与年平均流入量的比率(Anghileri等人,2016;Li等人,2024)。本研究采用了该指标的修改版本,使用正常条件下的有效存储容量(即总容量减去非活动存储容量,由最小值和表示)来代替总容量。利用概念性的存储调节曲线,这一修订后的指标能够更准确地捕捉可用调节容量,在本文中被称为“规模比率”。

2.1.2 水库运行表示的实证知识
Chen等人(2022年)开发了GDROM,它通过一组运行模块(每个模块对应特定条件下的一个运行动作)和一个管理这些模块之间转换的模块分类树来表示派生的运行规则。Li等人(2024年)将GDROM应用于美国大陆(CONUS)452个具有超过15年运行记录的水库,并发现了现实世界水库运行中的普遍模式。研究发现,任何给定水库的运行都可以用相对较少的模块(从1到8个不等)来有效表示。此外,根据流量和存储在释放决策中的作用,这些模块可以分为五种基本类型,包括恒定释放、流量驱动的分段恒定释放、流量驱动的线性释放、存储驱动的分段恒定释放和存储驱动的非线性释放。另外,Li等人(2024年)发现模块之间的转换模式受到季节性、水库规模、运行目的和位置的影响。这些结果展示了使用这些模块作为“乐高”积木进行灵活水库建模的潜力。C+GDROM利用GDROM基于模块的运行表示形式,根据对现实世界水库运行策略(例如季节性切换、对极端条件的调整响应)和概念性存储调节曲线的综合理解,预先定义了模块类型和模块转换条件。为了使模型更具可解释性,并适用于数据有限的条件,C+GDROM基于三种简化的模块类型构建:恒定释放、流量驱动的线性释放和存储驱动的线性释放。这种简化基于两个考虑因素。首先,这三种保留的类型捕捉了核心的释放行为,同时保持了简单的数学结构(恒定或线性),这支持仅使用短历史记录(1-2年)进行参数估计。其次,Li等人(2024年)识别的更复杂的模块类型,如分段恒定或非线性形式,可以使用简化模块类型的组合来有效近似。对于这三种保留的模块类型,参数校准是直接的。对于恒定释放模块,释放值设置为相关运行背景下观察到的释放值的中位数;对于流量和存储驱动的线性模块,使用标准线性回归来估计释放方程的斜率和截距。这种设计在保持概念清晰度的同时,允许C+GDROM灵活地表示广泛的运行行为。

2.2 C+GDROM框架
C+GDROM框架引入了三种水库运行模型(图3):通用模型,适用于所有类型和规模的水库;以及两种专门模型——防洪模型和灌溉模型,分别针对主要服务于防洪或灌溉目的的水库设计。这些专门模型比通用模型包含了更详细和特定于目的的规则结构,当已知水库的主要运行目的并且至少有2年的现场运行记录来支持模块参数校准时,它们更为适用。在本节的其余部分,我们将详细介绍这三种模型的设计。

2.2.1 通用水库运行模型
通用模型(图3a)适用于各种主要目的(防洪、水力发电、灌溉、供水)和规模的水库。它适用于那些年内存储波动围绕其典型存储水平变化的水库,这种变化由概念性存储调节曲线表示。通用模型通过三个具有不同应用条件和释放规则的模块来表示这种运行逻辑,包括一个用于处理重大洪水情况的模块(模块1,恒定释放类型),以及两个用于管理正常运行的模块(模块2,存储驱动的线性类型;模块3,恒定释放类型)。由于大多数大型水库需要履行防洪功能(作为主要或次要目标),通用模型包含了一个防洪模块(模块1),当当前流量超过或等于历史自然流量的第99百分位数(即非超越概率为0.99)时激活。一旦触发,模块1会应用恒定释放,以模拟现实世界中在洪水高峰期间限制水库释放的策略,以减轻下游洪水损害。主要洪水阈值是基于对历史洪水运行的实证分析选择的,并通过研究中的美国水库的敏感性测试得到确认(支持信息S1中的图S2和S3)。值得注意的是,如果在水库应用模块1时其存储量低于典型存储量,则释放量会减少,以确保只排放超出保护目标的多余洪水。对于没有防洪功能的水库,省略模块1。模块2和3管理正常运行,在这种情况下,概念性存储调节曲线在释放决策中起重要作用。当水库存储量达到或超过典型存储水平时,模块2应用释放与存储偏差之间的线性关系,斜率为正,以确保较大的存储量增加会导致更大的释放量。当存储量低于典型水平时,模块3提供恒定的低释放量,以满足基本的水量需求(例如环境流量),并恢复存储量至正常水平。模块2和3共同实现了自调节的释放决策,保持模拟存储量接近典型水平。如表1所总结的,还实施了与水库存储量相关的额外释放决策规则,以防止溢出和耗尽。同时,现实世界的水库运行需要避免突然的释放变化。我们在C+GDROM中提出了一些简单的坡度率约束,如表1中所列。在C+GDROM中,这些约束通常在与极端事件相关的短暂模块转换期间或存储边界下生效,因此对长期模拟性能的影响有限。然而,坡度率约束有助于防止不现实的短期释放波动。这些后处理规则的参数是特定于水库的,理想情况下是根据现实世界的运行政策(例如水库调节手册)得出的;否则,应用第2.5节中描述的默认值。表1中列出的规则一致地应用于本研究中的所有C+GDROM模型。

2.2.2 防洪水库运行模型
对于以防洪为主的水库,洪水高峰后的运行旨在迅速排放存储的洪水水量,超过洪水限制水位(FLWL),以恢复未来风暴事件所需的足够存储容量(Funato等人,2024年),其中FLWL由本研究中推导出的概念性存储曲线表示。为了捕捉这种行为,我们提出了防洪模型,该模型基于通用模型构建,但将之前的模块2分为两个子模块,即模块2a和2b,如图3b所示。当流量超过高流量阈值时,应用模块2a;否则,应用模块2b。高流量阈值是通过敏感性测试确定的(支持信息S1中的图S4)。模块2a旨在表示洪水高峰后流量仍然较高时的快速存储减少。同时,模块2a也可能代表小规模洪水期间的运行。在模块2a下,释放量假设遵循流量或存储偏差的线性函数,具体取决于水库的规模比率。Li等人(2024年)发现,当规模比率低于0.2时(遵循原始的定义),流量驱动的模块占主导地位。统计分析(支持信息S1中的图S5)和本研究的敏感性测试(支持信息S1中的图S6)确定0.15为区分模块2a下流量驱动和存储驱动运行的最佳阈值。模块2b继承了通用模型中模块2的公式;对于规模比率≤0.15的防洪水库,我们的结果表明,将模块2b的截距(即图3b中的)设置为零可以提高校准性能。

2.2.3 灌溉水库运行模型
Li等人(2024年)指出,灌溉水库表现出独特的季节性运行周期,其特点是低流量期间为恒定释放补充模块,而在灌溉季节为水释放模块。基于这些见解,我们开发了灌溉模型,该模型包含五个模块,以表示以灌溉为主的水库的季节性和需求驱动行为(图3c)。考虑到许多美国灌溉水库在春季融雪期间(例如密苏里州和上科罗拉多地区)或冬季风暴期间(例如太平洋西北地区)也具有次要的防洪功能,灌溉模型包括两个与洪水相关的模块。模块1直接继承了通用模型中的主要洪水模块,在流量超过特定值时应用恒定释放。模块2管理其他高流量情况,并假设释放与存储偏差之间的线性关系。对于模块2,我们建议使用默认模块参数(在第2.3节中详细说明),以减少切换到模块3-5时的日释放波动。在灌溉模型中,模块3、4和5是基于恒定释放的模块(稍后进行了一些调整),旨在反映受季节性模式控制的水资源保护和灌溉释放。模块3、4和5之间的转换由一年中的三个关键日期(DOYs)决定,这些日期反映了水库释放行为的显著变化,如支持信息S1中的文本S1所述。具体来说,模块3管理主要灌溉季节,并应用恒定释放以满足灌溉需求。模块4在春季高流量期间运行,保持适度的恒定释放。模块5从灌溉季节结束到雨季开始运行,提供低恒定释放,以满足基本下游流量需求。这些设计基于对现实世界以灌溉为主的水库的观察到的季节性释放模式,例如Keechelus Lake和Green Mountain Reservoir(支持信息S1中的图S7)。然而,由于模块3-5依赖于固定的季节性时间表和恒定释放,它们可能对湿年份的存储变化反应不敏感,从而导致不现实的存储动态。为了缓解这一限制,我们加入了一个额外的存储响应项,有助于防止不现实的存储积累(如支持信息S1中的文本S1所解释的),同时保持主要的季节性结构。

2.3 数据稀缺水库的默认释放模块参数
现实世界的水库运行记录(每日流量、释放量、存储观测数据)往往难以获得。当此类现场数据不可用时,我们建议使用通用模型(图3a)和默认模块参数,无论水库的主要运行目的和其他属性如何。本节介绍了C+GDROM通用模型的默认设置。特定于水库的概念性存储调节曲线仍然是模型所需的输入。鉴于最近发布的基于遥感(RS)的水库存储产品(例如Yadav等人,2025年),我们假设在真正数据稀缺的情况下可以使用这些产品来估计概念性存储曲线。水库流量的统计指标(例如平均值、中位数、百分位数)通常用于概念性水库模型中,以定义默认释放决策和参数值(例如Hanasaki等人,2008年;Zajac等人,2017年)。遵循这种方法,我们使用流量统计数据和从历史水库运行记录中得出的经验关系来估计通用模型中每个模块的默认参数,并计算释放量,如表2所总结。

表2. 通用模型中的默认释放公式
模块 默认释放公式
模块1 模块2 模块3
规模比率 > 0.4 模块2 模块3模块2(基于存储的线性模块)和模块3(恒定释放模块)负责非洪水高峰期的运营。模块2下的默认基于存储的线性方程是根据目标存储和释放操作方案(Burek等人,2013年)改编的。遵循Hanasaki等人(2008年)的方法,我们使用一个大小比例阈值来区分两组水库,并规定不同的参数值。然而,由于本研究使用了修改后的大小比例定义,阈值被设定为0.4,而不是Hanasaki等人(2008年)使用的0.5,这一设定得到了数值实验结果(支持信息S1中的图S9)的支持。每组水库都有不同的最优参数值,这突显了水库容量在调节流量中的关键作用(Li等人,2024年)。例如,对于大型水库(大小比例>0.4),模块3下的最优恒定释放量为,这表明即使存在存储不足,这些大型水库也能保持接近中位数的稳定释放量。对于小型水库(大小比例≤0.4),最优恒定释放量为,这有助于在出现不足时加速恢复到。总体而言,这些默认参数设置旨在反映现实世界水库中的广泛运营模式,并使C+GDROM通用模型在没有现场数据的情况下也能再现真实行为。

2.4 对比基准模型

本研究选择了三个通用的概念性水库运营模型作为基准模型。这些模型分别由Hanasaki等人(2008年)、Wisser等人(2010年)和Zajac等人(2017年)提出,在本研究中分别称为HANA、WISS和ZAJC。这些模型已被整合到多个全球和大陆水文模型中以改进模拟效果。例如,HANA已被纳入VIC(Droppers等人,2020年)、MATSIRO(Pokhrel等人,2012年)和MIROC-INTEG_LAND(Yokohata等人,2020年)等模型中。WISS被采用在WBM-plus模型中(Fekete等人,2010年;Wisser等人,2010年),而ZAJC被用于LISFLOOD(Burek等人,2013年;Zajac等人,2017年)。此外,我们还考虑了一个忽略水库运营的案例,称为ResIgnore,它为量化水库运营对自然流量的影响提供了参考。在ResIgnore下,通过直接比较水库流入量和观测到的释放量来评估释放模拟性能。每个基准模型的详细描述和释放公式在支持信息S1的文本S2中提供。表3总结了这些基准模型与提出的C+GDROM框架的关键特征,并进行了比较。

2.4 基准模型比较

本研究选择了三个通用的概念性水库运营模型作为基准模型。这些模型分别由Hanasaki等人(2008年)、Wisser等人(2010年)和Zajac等人(2017年)提出,在本研究中分别称为HANA、WISS和ZAJC。这些模型已被整合到多个全球和大陆水文模型中以改进模拟效果。例如,HANA已被纳入VIC(Droppers等人,2020年)、MATSIRO(Pokhrel等人,2012年)和MIROC-INTEG_LAND(Yokohata等人,2020年)等模型中。WISS被采用在WBM-plus模型中(Fekete等人,2010年;Wisser等人,2010年),而ZAJC被用于LISFLOOD(Burek等人,2013年;Zajac等人,2017年)。此外,我们还考虑了一个忽略水库运营的案例,称为ResIgnore,它为量化水库运营对自然流量的影响提供了参考。在ResIgnore下,通过直接比较水库流入量和观测到的释放量来评估释放模拟性能。每个基准模型的详细描述和释放公式在支持信息S1的文本S2中提供。表3总结了这些基准模型与提出的C+GDROM框架的关键特征,并进行了比较。

3 结果

3.1 概念性存储调节曲线的验证和可解释性

基于历史存储中位数,概念性存储调节曲线使用四个分段线性阶段进行参数化,每个阶段由六个参数(A1-A4和)表征。本节评估了该曲线在表示典型存储变化模式方面的表现,并展示了所推导参数的可解释性。分析针对的是202个具有明显年度充水-放水周期的水库(通过年和之间的相对差异超过10%的阈值来定义),其大小比例高于0.03,从而排除了调节能力可以忽略的水库。结果(表4)显示,概念性存储曲线在再现年度历史存储中位数方面的KGE中位数为0.96,只有5%的水库的KGE值低于0.83。这一结果表明,尽管水库的充水和放水过程本质上是非线性的,但基于线性段的概念性曲线足以代表广泛水库的主要存储变化模式。表4显示了概念性存储曲线在再现202个水库年度历史存储中位数方面的性能,通过KGE及其三个组成部分进行评估。

除了简单性之外,可解释性是所提出的概念性存储调节曲线的另一个关键优势。每个参数都有明确的操作含义:四个时间参数(A1-A4)近似充水和放水季节之间的转换;而两个存储水平参数(和)代表典型的年度最小和最大存储水平(分别表示为min.和max.)。图4a展示了按水库主要功能分组的202个美国大陆水库的min.和max.的分布,这些分布根据存储容量进行了标准化。结果显示,与主要运营目的相关联的存储模式具有明显的差异。以水电为主的水库(129个)通常具有较高的max.和较大的min.和max.之间的范围,这表明它们的大部分存储容量在年度调节周期内被常规利用以获得节水效益。以灌溉为主的水库(66个)主要位于美国西部;水电和供水兼顾的水库(39个)分布在美国大陆各地(见支持信息S1中的图S11)。该数据集去除了存储数据的异常值,并使用线性插值填补了缺失的记录。在本研究中,使用这256个水库来评估C+GDROM的性能。观测到的历史最大和最小存储值分别用于估算每个水库的总存储容量和死存储容量。为了评估在数据有限或甚至没有数据的情况下C+GDROM框架的性能,我们设计了两种类型的模拟实验:数据稀缺(没有现场运营数据)和数据有限(只有2年的运营数据,包括每日流入量、释放量和存储量)。在数据稀缺的情况下,我们应用第2.3节描述的通用模型和默认模块参数设置,并假设所有研究的水库都提供功能控制,作为主要或次要功能,因此始终启用模块1。在数据有限的情况下,我们假设只有2年的历史运营数据可用于释放模块的校准,并重点关注专门模型的校准性能,因为它们更能反映特定目的的运营行为。也就是说,对于129个以洪水控制为主的水库,使用洪水控制模型进行参数校准;对于66个以灌溉为主的水库,使用灌溉模型。在每种情况下,使用2年的数据来估计流入量或存储量驱动的线性模块类型的斜率和截距,以及恒定释放模块类型的释放值。为了减少来自任何特定时期的潜在校准偏差,我们使用13个不同的2年窗口(1990-1991年、1992-1993年……、2014-2015年)来独立校准每个水库的模型,每个水库有13种校准方案。在本研究中,使用每个水库自1990年以来的全部数据(至少25年)来评估所有实验(使用C+GDROM或基准模型,在数据有限或数据稀缺条件下)的模型性能,以评估长期模拟的准确性。在评估过程中,模型以每日流入量为输入,并使用水量平衡方程计算每日释放量。释放和存储的模拟准确性使用Nash–Sutcliffe效率(NSE;Nash & Sutcliffe,1970)和Kling–Gupta效率(KGE;Gupta等人,2009)进行评估。需要注意的是,C+GDROM需要特定的概念性存储调节曲线作为输入。在本研究中,这些六个曲线参数(A1-A4和)是根据历史现场存储数据估算的。在实际应用中,对于数据有限或数据稀缺的水库,这样的存储信息可以从遥感观测中得出,如第4.2节中的示例所示。此外,在我们的实验中,水库流入量的统计指标(即等)是根据长期历史数据计算的,而如果历史数据不可用,用户可以使用水文模型生成的流入量序列。为了增强C+GDROM的运营模拟,本研究还纳入了与大坝安全和爬坡率限制相关的额外释放决策规则,详见表1。这些规则的参数反映了操作者的经验,理想情况下应根据每个水库的实际运营政策确定或使用适当的现场数据进行校准。然而,鉴于我们关注在数据有限和数据稀缺条件下评估模型性能,这些详细信息不可用,我们在所有研究的水库中应用了统一的默认参数值。具体来说,爬坡率限制中的和分别设置为2和0.5。此外,由于水库存储区域边界通常不可用,概念模型通常依赖于经验定义的默认容量比例(例如,Zajac等人,2017年)。因此,我们将近似为总存储容量的0.99,保留剩余的1%作为应急存储,以避免溢出。

3 结果

3.1 概念性存储调节曲线的验证和可解释性

基于历史存储中位数,概念性存储调节曲线使用四个分段线性阶段进行参数化,每个阶段由六个参数(A1-A4和)表征。本节评估了该曲线在表示典型存储变化模式方面的表现,并展示了所推导参数的可解释性。分析针对的是202个具有明显年度充水-放水周期的水库(通过年和之间的相对差异超过10%的阈值来定义),其大小比例高于0.03,从而排除了调节能力可以忽略的水库。结果(表4)显示,概念性存储曲线在再现年度历史存储中位数方面的KGE中位数为0.96,只有5%的水库的KGE值低于0.83。这一结果表明,尽管水库的充水和放水过程本质上是非线性的,但基于线性段的概念性曲线足以代表广泛水库的主要存储变化模式。表4显示了概念性存储曲线在再现202个水库年度历史存储中位数方面的性能,通过KGE及其三个组成部分进行评估。

除了简单性之外,可解释性是所提出的概念性存储调节曲线的另一个关键优势。每个参数都有明确的操作含义:四个时间参数(A1-A4)近似充水和放水季节之间的转换;而两个存储水平参数(和)代表典型的年度最小和最大存储水平(分别表示为min.和max.)。图4a展示了按水库主要功能分组的202个美国大陆水库的min.和max.的分布,这些分布根据存储容量进行了标准化。结果显示,与主要运营目的相关的存储模式具有明显的差异。以水电为主的水库通常具有较高的max.和较大的min.和max.之间的范围,这表明它们的大部分存储容量在年度调节周期内被常规利用以获得节水效益。图4展示了年度典型最小(min.,蓝色)和最大(max.,绿色)存储水平的分布:(a) 按水库主要运营目的分组的202个美国水库的min.和max.值标准化;(b) 107个以洪水控制为主的水库(左侧面板)和64个以灌溉为主的水库(右侧面板)的min.和max.的月度分布。在子图(b)中,y轴显示了处于min.和max.的水库数量。相比之下,以洪水控制为主的水库(107个水库)通常具有较低的max.值(中位数=0.47),以及较小的min.和max.之间的范围。这反映了大多数研究中的洪水控制水库需要在全年保持足够的防洪空间(超出单个洪水控制季节),这些水库主要位于阿肯色-怀特-红河(27个水库)、俄亥俄(31个水库)和田纳西(13个水库)地区。尽管如此,洪水控制水库之间的max.存在显著差异,因为一些水库还承担次要的灌溉或供水功能,特别是在太平洋西北地区(10个水库),那里的季节性节水目标提高了max.。以供水为主的水库始终显示出较高的min.,以确保供水可靠性,尽管它们的样本量较小(10个水库),这限制了更广泛的推断。我们进一步探讨了以洪水控制为主和以灌溉为主的水库的min.和max.的月度频率分布,这两种类型的水库合计占202个水库的85%(见图4b)。对于以洪水控制为主的水库,min.通常发生在12月至2月之间,而max.最常见于5月至8月之间。这些模式与俄亥俄地区、太平洋西北地区和田纳西地区的FLWLs的季节性变化一致,在这些地区,存储在冬季显著减少以减轻风暴引发的洪水风险(Li等人,2024年)。以灌溉为主的水库主要位于美国西部,其季节性变化由融雪驱动,max.集中在5月至7月之间(6月达到峰值),而min.通常发生在灌溉季节之后(10月至12月)。有趣的是,由于冬季的防洪需求(特别是在太平洋西北部和加利福尼亚州),或者美国西部(尤其是上科罗拉多地区)冬季来水量非常低,这些水库在三月或四月的蓄水量通常保持在较低水平,直到春季融雪开始蓄水量才会恢复。总体而言,这些结果表明概念性的蓄水量调节曲线既具有代表性又易于解释。尽管其形式简化为线性,但它有效地捕捉了典型的蓄水量动态,并揭示了有意义的季节性、区域性和功能性运行模式。C+GDROM将这一曲线嵌入到模块转换条件和释放决策规则中,从而实现了现实的蓄水量模拟。这不仅便于评估参数的适用性,还有助于比较具有不同运行目的的水库之间的运行行为。

3.2 在数据稀缺条件下对C+GDROM通用模型的评估

图5展示了在数据稀缺条件下,通过KGEs对236个美国水库的不同水库模型进行的日释放量和蓄水量模拟性能评估。其中256个水库中有20个由于其对径流的影响可以忽略不计而被排除在外,这些水库的大小比率低于0.03,其KGE中值为0.97(NSE中值为0.96),在ResIgnore设置下。支持信息S1中的图S12提供了基于NSE的类似图表,显示了一致的模式。在数据稀缺条件下,所有水库模型都使用其默认的模块参数值进行评估。在本节中,C+GDROM特指使用默认模块参数的通用模型,C+GDROM在各个水库中的性能地图分别见支持信息S1中的图S13和S14。图5展示了在数据稀缺条件下(即使用默认参数)不同水库模型的日释放量和蓄水量模拟结果,由KGEs进行评估。(a)所有水库每种模型的KGE分数的累积分布函数(CDF);向右移动表示整体性能提升。(b)按主要水库功能分组的C+GDROM和ZAJC性能比较。(c)按主要大小比率分组的C+GDROM和ZAJC性能比较。如图5a所示,在数据稀缺条件下,C+GDROM在释放量和蓄水量模拟方面均显著优于基准模型(ZAJC、HANA、WISS和ResIgnore)。在释放量模拟中,C+GDROM的中位KGE为0.64,而ZAJC为0.58,HANA为0.37,WISS也为0.37。值得注意的是,C+GDROM显著减少了模拟结果不佳的情况:在C+GDROM下,只有17%的水库释放量模拟的KGE低于0.5,而在ZAJC下为35%,HANA下为65%,WISS下为69%。在蓄水量模拟方面,C+GDROM的改进更为显著:超过50%(以KGE计)和85%(以NSE计)的HANA和WISS模拟的水库在蓄水量方面得分较低。ZAJC虽然优于HANA和WISS,但仍有14%和44%的水库的KGE和NSE为负值。相比之下,C+GDROM将这些比例降低到了4.2%(KGE < 0)和17%(NSE < 0),并且中位性能分别提升到了0.63(KGE)和0.52(NSE)。这些改进主要归功于概念性蓄水量调节曲线的引入,该曲线将模拟的蓄水量限制在更符合实际的季节性模式内。为了进一步研究模型性能,我们比较了C+GDROM和ZAJC(基准模型中表现最好的模型)在不同水库类别(按主要功能划分,见图5b)和按大小比例划分(见图5c)下的表现。如图5b所示,C+GDROM在所有功能类别中的表现均优于基准模型。在数据稀缺条件下,C+GDROM在释放量和蓄水量模拟方面的表现尤为突出。

3.2 在数据稀缺条件下对C+GDROM通用模型的评估

图5展示了在数据稀缺条件下,通过KGEs对236个美国水库的不同水库模型进行的日释放量和蓄水量模拟性能评估。其中256个水库中有20个由于其对径流的影响可以忽略不计而被排除在外,这些水库的大小比率低于0.03,其KGE中值为0.97(NSE中值为0.96),在ResIgnore设置下。支持信息S1中的图S12提供了基于NSE的类似图表,显示了一致的模式。在数据稀缺条件下,所有水库模型都使用其默认的模块参数进行评估。在本节中,C+GDROM特指使用默认模块参数的通用模型,C+GDROM在各个水库中的性能地图分别见支持信息S1中的图S13和S14。图5展示了在数据稀缺条件下(即使用默认参数),通过KGEs对236个美国水库的不同水库模型进行的日释放量和蓄水量模拟结果。(a)所有水库每种模型的KGE分数的累积分布函数(CDF);向右移动表示整体性能提升。(b)按主要水库功能分组的C+GDROM和ZAJC性能比较。(c)按主要大小比率分组的C+GDROM和ZAJC性能比较。如图5a所示,在数据稀缺条件下,C+GDROM在释放量和蓄水量模拟方面均显著优于基准模型(ZAJC、HANA、WISS和ResIgnore)。在释放量模拟中,C+GDROM的中位KGE为0.64,而ZAJC为0.58,HANA为0.37,WISS也为0.37。值得注意的是,C+GDROM显著减少了模拟结果不佳的情况:在C+GDROM下,只有17%的水库释放量模拟的KGE低于0.5,而在ZAJC下为35%,HANA下为65%,WISS下为69%。在蓄水量模拟方面,C+GDROM的改进更为显著:超过50%(以KGE计)和85%(以NSE计)的HANA和WISS模拟的水库在蓄水量方面得分较低。ZAJC虽然优于HANA和WISS,但仍有14%和44%的水库的KGE和NSE为负值。相比之下,C+GDROM将这些比例降低到了4.2%(KGE < 0)和17%(NSE < 0),并且中位性能分别提升到了0.63(KGE)和0.52(NSE)。这些改进主要得益于概念性蓄水量调节曲线的引入,该曲线将模拟的蓄水量限制在更符合实际的季节性模式内。为了进一步研究模型性能,我们比较了C+GDROM和ZAJC(基准模型中表现最好的模型)在不同水库类别(按主要功能划分,见图5b)和按大小比例划分(见图5c)下的表现。如图5b所示,C+GDROM在所有功能类别中的表现均优于基准模型。在释放量模拟方面,水电水库的改进最为显著,尽管样本量较小(24个水库)。在蓄水量模拟方面,防洪水库的改进最为显著(127个水库),其中的中位KGE从ZAJC的0.36提升到了C+GDROM的0.66。防洪水库通常表现出可预测的季节性蓄水量模式,因为其有规定的防洪空间。由于概念性蓄水量曲线合理反映了这些规律性动态,因此其表现特别好,从而实现了显著的性能提升。C+GDROM在大小比率不同的水库中也优于ZAJC,尽管当大小比率超过1时,性能提升变得不那么明显(见图5c)。正如预期的那样,两种模型在大小比率增加时释放量模拟性能都会下降。这是因为较大的水库能够更有效地缓冲来水量的变化,从而更大程度地实现需求驱动的释放决策。因此,在非常大的水库中使用基于蓄水量或来水量的规则进行释放量模拟效果较差。有趣的是,蓄水量模拟与大小比率之间存在非单调关系:对于大小比率小于0.4的水库,性能提升,而对于较大的水库(当比率接近0.5时),性能则会下降,这两种模型都观察到了这一现象。这是因为小型水库受到来水量变化的影响较大,导致其蓄水量难以模拟(Li等人,2024年)。相比之下,中型水库(大小比率在0.3到0.5之间)往往遵循稳定的年内蓄水量模式,C+GDROM内置的概念性蓄水量曲线能够更准确地模拟这些模式。对于那些大型水库(大小比率>0.5),蓄水量不仅从湿润季节延续到干燥季节,还会从湿润年份延续到干燥年份,存在年际间的蓄水量变化。也就是说,这些水库的运行可能不会严格遵循蓄水量调节曲线。然而,鉴于总体性能表现稳健(大小比率低于1的水库在释放量和蓄水量模拟中的中位KGE值均超过0.5),C+GDROM仍然适用于不同大小组的水库。

3.3 在数据有限条件下对C+GDROM的校准和评估

3.3.1 防洪模型的校准和评估

对于127个以防洪为主的水库,我们在数据有限条件下(即仅使用2年的运行数据)应用防洪模型进行校准实验。为了减少与特定时期相关的潜在校准偏差,我们使用了13个不同的2年时间段(1990–1991、1992–1993……、2014–2015)来独立校准每个水库的模型。图6a和6b展示了从13个校准案例中得出的最佳、中等和最差NSE/KGE的CDF(例如,最佳情况的CDF是由每个水库13个校准案例中的最佳NSE组成的),并与使用默认参数的通用模型的性能进行了比较。

在数据有限条件下,基于C+GDROM的日释放量和蓄水量模拟的NSE和KGE的CDF:(a) 对于使用防洪模型的127个以防洪为主的水库;(b) 对于使用灌溉模型的64个以灌溉为主的水库。每条曲线代表从13个校准窗口中得出的代表性校准场景下的模型性能:最佳(灰色虚线)、中等(蓝色虚线)、最差(绿色虚线)以及未校准(即使用默认参数的通用模型,红色)。在(c)和(d)中,还展示了使用2008–2009数据的校准后的通用模型(浅蓝色)以供比较。总体而言,尽管仅使用2年的数据来进行释放模块校准,但校准后的防洪模型显著提高了整体模拟的准确性,这一点从中位情况可以看出。然而,图6a和6b也显示了模型性能对校准窗口的敏感性。最佳情况相比默认设置有显著改进,而最差情况的校准效果甚至比默认设置更差。值得注意的是,最差情况的校准通常对应于严重的干旱年份,如支持信息S1中的图S15所示。例如,2012–2013年期间,美国各地经历了广泛的严重干旱(NOAA,2013年),导致许多水库的模型校准偏差和NSE值较低(支持信息S1中的图S16)。同样,区域性的干旱,如2000至2004年美国西部和西南部的干旱(NOAA,2003年、2005年),以及2001–2002年和2007年美国东南部的干旱(NOAA,2007年),也导致这些地区的水库在相应时间窗口内的模型性能较差。不受干旱条件影响的校准期间,模型性能相对稳定。例如,2008–2009年期间,水文条件接近平均水平,产生的模拟指标(NSE和KGE)与所有13个校准案例的中位数一致(支持信息S1中的图S17)。此外,校准在蓄水量模拟方面的改进比在释放量模拟方面更为显著,KGE的提高幅度大于NSE(图6a和6b)。对于KGE而言,中位值从0.52提高到0.61(释放量),从0.66提高到0.73(蓄水量)。然而,NSE的改进较小,尤其是在释放量模拟中,这可能是由于其对峰值数据的敏感性和在非极端条件下的系统改进响应有限(Clark等人,2021年;Vora等人,2024年)。为了更好地评估释放性能,我们引入了百分比偏差(PBIAS)并在三种流量条件下对其进行评估:高流量()、中等到高流量()和低到中等流量()。图7显示了使用2008–2009年窗口校准后的C+GDROM和通用模型的127个水库的PBIAS分布,与使用默认参数的通用模型进行了比较。观察到通用模型在高流量期间倾向于高估释放量,而在中等到高流量期间低估释放量。相比之下,防洪模型产生的PBIAS分布更集中于零附近。在高流量期间,改进尤为明显:PBIAS在±10%和±20%范围内的水库比例从41%增加到64%(默认设置),增加到69%和89%(校准后)。在中等到高流量期间,绝对PBIAS超过30%的水库比例从16%减少到5.5%。在低到中等流量期间,两种模型的性能都较弱;然而,校准仍然将绝对PBIAS超过20%的水库比例从51%(默认设置)减少到32%(校准后)。图7展示了使用C+GDROM防洪模型的127个以防洪为主的水库在三种流量条件下的释放量模拟中百分比偏差(PBIAS)分布:(a) 低到中等流量(),(b) 中等到高流量(),(c) 高流量()。使用2008–2009年数据校准的防洪模型的结果用蓝色表示,使用默认参数的通用模型的结果用绿色表示。总之,C+GDROM框架内的防洪模型可以使用较短的运行记录(2年)进行有效校准,并为以防洪为主的水库实现满意的模拟性能。特别是,在高流量条件下,校准带来了显著的模拟改进,这对于洪水管理非常重要。然而,当校准周期较短时必须谨慎。使用涉及极端事件的短期运行数据可能导致参数估计偏差和相对于默认设置的性能下降,而较长的校准数据可以减少这种偏差。

3.3.2 灌溉模型的校准和评估

对于64个以灌溉为主的水库,我们在C+GDROM框架内应用灌溉模型,并评估其在数据有限条件下的释放模块校准性能。校准使用了13个不同的2年时间段,图6c和6d总结了由此产生的模拟性能,突出了最佳、中等和最差情况的结果(基于13个时间段的NSE和KGE)。作为对比,我们还使用通用模型进行了校准实验。如图6c和6d中的中位情况校准场景所示,使用有限数据校准C+GDROM的灌溉模型通常比使用默认设置时的模拟效果更好。与防洪模型的情况类似,KGE的提高幅度大于NSE的提高幅度。蓄水量模拟受益最大,25百分位的KGE从0.38提高到0.56,中位KGE从0.57提高到0.73,这主要是由于KGE中的相关性和方差分数(即和成分)得到了改善。这些改进源于灌溉模型的设计,该模型明确纳入了基于灌溉日的和需求驱动的释放规则,更好地代表了灌溉操作的季节性变化。例如,华盛顿州Keechelus水库的灌溉模型捕捉到了独特的季节性释放模式,因此比通用模型更准确地模拟了蓄水量动态(支持信息S1中的图S18)。与防洪模型的结果一致,灌溉模型的性能也受到校准时期选择的影响(图6c和6d)。所研究的以灌溉为主的水库主要位于美国西部,包括太平洋西北部、上科罗拉多河、密苏里地区和加利福尼亚地区。最差的校准情况对应于1996–1997年、1998–1999年、2002–2003年和2006–2007年(支持信息S1中的图S19),这些时期在这些地区分别经历了极端干旱或洪水条件。值得注意的是,1996-1999年间发生了多次严重的洪水事件,例如1996年美国太平洋西北部的洪水(USACE,2021年)、1997年加利福尼亚的新年洪水(Lott等人,1997年)以及1997年和1999年科罗拉多州的大规模洪水(Weaver等人,2000年)。当使用这些异常的洪水年份进行校准时,它们会引入偏差,导致模型性能不佳,尤其是在存储模拟方面。相反,使用水文条件较为温和的校准期(如2008-2009年)可以得到稳健可靠的模型性能(见支持信息S1中的图S20)。重要的是,在数据有限的情况下校准以灌溉为主的水库的通用模型并不能提高性能,反而可能比使用默认参数时表现更差(见图6c)。这是因为通用模型主要是基于存储的,而灌溉操作则强烈受到季节(通过灌溉日DOY)和用水需求的驱动。用有限的数据校准这种不匹配的模型结构可能会导致参数估计出现较大偏差。这些发现强调了在使用数据有限的情况下,使用针对水库功能定制的操作模块(规则)的重要性。

4 讨论

4.1 关于洪水控制操作的表示
现有的概念性水库运行方案中,洪水控制操作往往被忽视。基于流入量和需求量的方法,包括HANA(Hanasaki等人,2008年)和WISS(Wisser等人,2010年)模型,并没有纳入特定的洪水控制规则。目标存储和释放方法(例如Burek等人,2013年;Dong等人,2022年;Yassin等人,2019年;Zajac等人,2017年)通过引入特定的洪水控制规则(见支持信息S1中的文本S2中的方程S1)向前迈出了一步。ZAJC模型(Zajac等人,2017年)中的洪水控制规则考虑了影响洪水控制释放的关键因素,包括水库流入量、存储水平和下游安全流量(见支持信息S1中的方程S1),然而,其公式可能无法捕捉到现实世界的洪水控制操作实践。具体来说,它假设当...时(其中...近似于下游安全流量),水库释放量会与流入量成比例增加(假设洪水控制区域正在被利用)。图8显示了美国四个以洪水控制为主的水库的日观测高流入量(当...时)与相应释放量之间的关系。如图所示,当流入量超过某个大阈值时,水库释放量保持较低且稳定,而不是随着流入量的增加而增加。这种模式在美国许多水库中都有观察到,反映了实际的洪水控制原则:在重大洪水事件期间,水库通过暂时保留洪水来减少洪峰并维持下游控制点的稳定安全流量,除非存在大坝溢出的风险,或者水库的洪水调节能力有限,例如Fall Creek Lake(见图8d)。

4.2 使用遥感数据推导概念性存储调节曲线
概念性存储调节曲线是C+GDROM的关键输入。在本节中,我们展示了使用遥感数据来确定存储曲线六个参数的例子,并评估C+GDROM性能对存储不确定性的敏感性。选择了三个水库作为示范示例。为了获得它们的遥感存储估计值,我们首先从SARAH-CONUS数据集(Yadav等人,2025年)中检索卫星衍生的水面面积数据,该数据集基于Harmonized Landsat和Sentinel-2(HLS)图像,提供了2016年至2023年美国本土的亚周级高空间分辨率数据(Claverie等人,2018年)。然后,使用GRDL数据集(Hao等人,2024年)中的水库特定面积-存储-深度关系将水面面积观测值转换为存储体积。为了考虑遥感数据中的不规则观测间隔和测量不确定性,计算了每周的中位存储值,并通过最小化与每周中位数的偏差来推导概念性存储调节曲线。图10将基于遥感的概念性存储调节曲线(称为基于RS的曲线)与基于历史实地存储记录的曲线进行了比较,用于三个选定的美国水库。对于印第安纳州的J. Edward Roush Lake(图10a),基于RS的曲线与基于观测的曲线非常吻合,只有一个时间参数有轻微差异。同样,Buffalo Bill Reservoir(图10b)的基于RS的曲线也捕捉到了基于观测的曲线的整体形状,尽管高估了最小存储量10%。重要的是,这些小的偏差对释放模拟性能的影响有限:使用基于RS的曲线时,J. Edward Roush Lake的释放标准误差(NSE)保持不变(0.59),而Buffalo Bill Reservoir的NSE略有下降(从0.60降至0.53)。

4.3 使用遥感数据推导概念性存储调节曲线
概念性存储调节曲线是C+GDROM的关键输入。在本节中,我们展示了使用遥感数据来确定存储曲线六个参数的例子,并评估C+GDROM性能对存储不确定性的敏感性。选择了三个水库作为示范示例。为了获得它们的遥感存储估计值,我们首先从SARAH-CONUS数据集(Yadav等人,2025年)中检索卫星衍生的水面面积数据,该数据集基于Harmonized Landsat和Sentinel-2(HLS)图像,提供了2016年至2023年美国本土的亚周级高空间分辨率数据(Claverie等人,2018年)。然后,使用GRDL数据集(Hao等人,2024年)中的水库特定面积-存储-深度关系将水面面积观测值转换为存储体积。为了考虑遥感数据中的不规则观测间隔和测量不确定性,计算了每周的中位存储值,并通过最小化与每周中位数的偏差来推导概念性存储调节曲线。图10将基于遥感的概念性存储调节曲线(称为基于RS的曲线)与基于历史实地存储记录的曲线进行了比较。对于印第安纳州的J. Edward Roush Lake(图10a),基于RS的曲线与基于观测的曲线非常吻合,只有一个时间参数有轻微差异。同样,Buffalo Bill Reservoir(图10b)的基于RS的曲线也捕捉到了基于观测的曲线的整体形状,尽管高估了最小存储量10%。重要的是,这些小的偏差对释放模拟性能的影响有限:使用基于RS的曲线时,J. Edward Roush Lake的释放标准误差(NSE)保持不变(0.59),而Buffalo Bill Reservoir的NSE略有下降(从0.60降至0.53)。

4.2 使用遥感数据推导概念性存储调节曲线
概念性存储调节曲线是C+GDROM的关键输入。在本节中,我们展示了使用遥感数据来确定存储曲线六个参数的例子,并评估C+GDROM性能对存储不确定性的敏感性。选择了三个水库作为示范示例。为了获得它们的遥感存储估计值,我们首先从SARAH-CONUS数据集(Yadav等人,2025年)中检索卫星衍生的水面面积数据,该数据集基于Harmonized Landsat和Sentinel-2(HLS)图像,提供了2016年至2023年美国本土的亚周级高空间分辨率数据(Claverie等人,2018年)。然后,使用GRDL数据集(Hao等人,2024年)中的水库特定面积-存储-深度关系将水面面积观测值转换为存储体积。为了考虑遥感数据中的不规则观测间隔和测量不确定性,计算了每周的中位存储值,并通过最小化与每周中位数的偏差来推导概念性存储调节曲线。图10将基于遥感的概念性存储调节曲线(称为基于RS的曲线)与基于历史实地存储记录的曲线进行了比较。对于印第安纳州的J. Edward Roush Lake(图10a),基于RS的曲线与基于观测的曲线非常吻合,只有一个时间参数有轻微差异。同样,Buffalo Bill Reservoir(图10b)的基于RS的曲线也捕捉到了基于观测的曲线的整体形状,尽管高估了最小存储量10%。重要的是,这些小的偏差对释放模拟性能的影响有限:使用基于RS的曲线时,J. Edward Roush Lake的释放标准误差(NSE)保持不变(0.59),而Buffalo Bill Reservoir的NSE略有下降(从0.60降至0.53)。

4.3 朝着LSHMs中的通用水库表示迈进:C+GDROM的应用与未来工作
C+GDROM框架旨在为大规模水文模型(LSHMs)提供通用、可解释且数据效率高的水库操作表示方法。水库模型在通用性和真实性之间面临权衡。C+GDROM提出了一个适用于所有类型水库的通用模型,以及两个变体——洪水控制模型和灌溉模型,以提高特定类型水库的性能。我们认识到C+GDROM模型无法复制实际用于特定水库的具体操作规则。尽管如此,现实世界的决策行为在C+GDROM中得到了隐含的表示。例如,Keystone Lake(Arkansas River,Oklahoma)的调节手册指出,每当有大量降雨时都需要进行洪水预报(USACE,2012年;更多理由见支持信息S1中的文本S3),这支持使用高流入量阈值来触发C+GDROM中规定的洪水操作。这两个模型变体还展示了更新基于模块的C+GDROM参数和组件的灵活性。例如,当前的灌溉模型在灌溉季节假设了一个简单的恒定释放模块(模块3),以捕捉代表性的操作行为,而不依赖于通常不可用的灌溉需求数据。人们认识到,实际的灌溉需求和相应的水库释放量会随着气候、作物类型和政策而变化。当有更多的灌溉数据可用时,将这些数据纳入模型以改进或替换恒定释放模块,为提出的灌溉模型提供了一个有前景的扩展。同样,其他操作细节,如存储区域边界和相关的释放计划(例如Zhang等人,2020年),也可以更新以定制模块应用条件和释放规则,从而更好地表示个别水库。C+GDROM的一个关键优势是其参数的物理可解释性,包括定义概念性存储调节曲线的参数。这些参数可以从历史数据中估计,或者使用水库操作知识来确定。这进一步使得一个重要的应用成为可能:通过调整目标存储曲线参数来探索在变化的水文气候条件下的潜在操作调整(Chen & Cai,2025年)。同时,C+GDROM中的几个阈值和默认参数是根据256个美国水库观察到的统计关系得出的。虽然C+GDROM在大量水库中的一致稳健性能支持了其普遍适用性,但其应用于全球水库可能还需要进一步的区域测试和某些参数的细化,特别是与灌溉相关的参数(例如灌溉季节时间)。在这项研究中,选择专门的洪水控制模型或灌溉模型时使用了来自GranD数据库(Lehner等人,2011年)的水库属性,该数据库是一个广泛使用的水库清单,包括主要操作目的。当在美国以外应用C+GDROM时,用户可以依赖GranD或其他区域水库数据库来确定水库的主要操作目的。我们认识到,许多水库具有多种功能,它们的主要目的并不总是明确的。在这种情况下,通常无法获得实地操作数据。在这种情况下,我们建议使用带有默认模块参数的通用模型。在选择洪水控制模型和灌溉模型时,需要实地(或足够准确的基于RS的)操作数据(≥2年的日流入量、释放量和存储量)来进行释放模块的校准。这项研究展示了使用遥感数据推导概念性存储调节曲线的潜力,以及C+GDROM对存储不确定性的稳健性;然而,仍需要使用可靠的基于RS的存储数据对真正数据稀缺的水库进行进一步评估。此外,C+GDROM旨在表示具有不可忽视调节能力的水库。对于对自然流量影响极小的非常小的水库(尺寸比≤0.03),我们的结果表明,排除它们不会降低长期模拟性能(即在ResIgnore方案下20个美国本土水库的中位NSE为0.96),而使用C+GDROM进行建模可能会降低性能。尽管如此,先前的研究表明,众多小水库的累积效应仍可能对水文产生显著影响(Habets等人,2018年)。因此,为LSHMs中表示聚合的小型水库设计特殊规则对于未来的研究仍然非常重要。

5 结论

本研究介绍了C+GDROM,这是一种混合了实证和概念性的水库运行模型,旨在改进LSHMs中的水库表示方法。C+GDROM建立在基于模块的通用数据驱动水库运行模型(GDROM;Chen等人,2022年)的基础上,通过明确参数化的运行模块及其转换条件来表示每日放水规则。该模型的特点在于整合了一个概念性的蓄水调节曲线,有助于保持物理上一致的蓄水动态,并结合了现实世界操作员的经验。特别是,这个概念性的蓄水调节曲线可以很容易地从有限的历史观测数据或遥感(RS)衍生的蓄水数据中得出。通过这种混合方法,C+GDROM保留了GDROM在真实水库表示方面的优势,同时提高了可解释性,并减少了由于数据不完整或噪声导致的建模不确定性。这些特性使得C+GDROM能够适用于数据有限的水库。C+GDROM提出了一个适用于所有类型水库的通用模型,并提供了两种变体(灌溉模型和防洪模型),以更好地表示防洪和灌溉等特定运行目的,而这些在现有的概念模型中往往被忽视。通过对美国256个水库的评估表明,在数据稀缺的情况下(即没有现场数据,使用默认模块参数),通用模型在放水和蓄水模拟方面的表现显著优于现有的概念方案(HANA、WISS、ZAJC)。由于整合了概念性的蓄水调节曲线,特别是在极端事件(洪水和干旱)期间评估蓄水调节对流量变化的影响方面,改进尤为显著。校准实验进一步表明,仅使用典型水文年的2年运行数据,就可以有效调整专门的C+GDROM变体,从而整体改善了蓄水和放水模拟的效果。为了支持C+GDROM在大型水文模型中的应用,我们利用了最近发布的GDROM v2数据集(Zheng等人,2025年)中的蓄水数据,为美国1,758个水库提供了预校准的参数值,包括概念性蓄水调节曲线参数和水库容量属性(Chen, Zheng, Wang, & Cai, 2026年)。这些参数值,连同本文讨论的入流时间序列及相关统计信息,使用户能够轻松地为这些水库实施C+GDROM。C+GDROM相比现有的概念模型具有关键优势,它提供了一个可解释且灵活的框架,能够表示真实的运行逻辑。C+GDROM的模型结构与LSHMs兼容,从而可以像GDROM一样轻松地将其与LSHMs集成(Vora等人,2024年)。然而,为了将C+GDROM扩展到全球应用,由于现场数据的稀缺性通常是一个挑战,未来的工作需要处理基于遥感数据衍生的蓄水估计的不确定性,并根据当地水库的运行数据完善C+GDROM树结构中的入流和蓄水阈值。

致谢

我们衷心感谢审稿人的深思熟虑和建设性反馈,这帮助我们显著提高了这项工作的质量。本研究得到了中国国家自然科学基金(项目编号42325702)、水文运行合作研究所(CIROH)的支持,后者获得了NOAA合作研究所计划下的NA22NWS4320003资助,以及高水平大学专项基金(项目编号G030290001)的支持。

利益冲突

作者声明与本研究无关的利益冲突。

数据可用性声明

美国256个水库的现场每日运行数据清单(每个水库都有超过25年的数据,从1990年开始)可以在HydroShare仓库中找到,相关文献为Chen等人(2025年,https://doi.org/10.4211/hs.092720588e2e4524bf2674235ff69d81)。C+GDROM的源代码和所研究水库的参数可以从Zenodo仓库中获取,相关文献为Chen, Zheng, 和 Cai(2026年,https://doi.org/10.5281/zenodo.18579767)。1,758个美国水库的预校准C+GDROM参数也可以在Hydroshare中找到,相关文献为Chen, Zheng, Wang, 和 Cai(2026年,https://doi.org/10.4211/hs.2d4202d3e9c04ce2bc17cba39f06d539)。

参考文献

Ketchum, D., Hoylman, Z. H., Huntington, J., Brinkerhoff, D., & Jencso, K. G. (2023). 灌溉强度增加对美国西部河流可持续性的影响。《地球与环境通讯》,4(1),479。https://doi.org/10.1038/s43247-023-01152-2

生物通微信公众号
微信
新浪微博


生物通 版权所有