城市洪水被认为是最具破坏性的自然灾害之一,近年来其发生频率越来越高,对公共安全和经济增长构成了重大威胁(IPCC, 2022; Rentschler et al., 2022; Spekkers et al., 2015)。城市洪水的复杂性源于降雨加剧和城市化的共同影响,这使得预测变得困难。尽管如此,现有研究表明未来城市洪水的风险预计将上升(Agonafir et al., 2023; Moon et al., 2024; Q. Zhang et al., 2025)。这一上升趋势可以归因于两个主要因素:首先,由于全球变暖,极端降水的频率和强度增加,直接增加了未来城市洪水的可能性(Ban et al., 2015; Kendon et al., 2014);其次,城市扩张以及相关的土地利用和土地覆盖变化通过土壤硬化扩大了不透水表面面积,降低了洪水排放能力,从而增加了洪水风险(Arnbjerg-Nielsen et al., 2013; Kundzewicz et al., 2014)。例如,2021年7月的郑州洪水就体现了极端降水和快速城市化的复合影响。创纪录的每小时降雨量201.9毫米远远超出了该城市的排水系统容量,而城市扩张导致的大量不透水表面减少了自然渗透,显著增加了地表径流,从而加剧了洪水的严重性。由于城市是人口和商业活动的集中地,自然灾害通常会导致巨大的生命和经济损失(Chakalian et al., 2019; Shield et al., 2021)。城市洪水淹没关键基础设施后,会引发连锁系统故障,放大直接和间接损失。作为关键基础设施之一,电网在城市洪水期间的暴露尤为明显(Danziger & Barabási, 2022; Li et al., 2023; Souto et al., 2022)。当电力基础设施被洪水淹没时,会导致大规模停电,进而破坏供水系统、切断通信网络并使互联网服务中断,使灾难情况更加复杂和严重。随着这些基本服务的中断,企业和行业被迫暂停运营,造成重大经济损失。因此,研究电网受城市洪水影响的情况已成为灾害风险降低和气候韧性研究中的关键优先事项。例如,Ye等人(2024)利用基础设施地图和脆弱性曲线量化了热带气旋引发的沿海洪水对东亚电力基础设施的预期年度损害(Ye et al., 2024)。面对日益严重的城市洪水威胁,最近的研究不再局限于一般的危险评估,而是转向开发明确描述洪水范围与电网拓扑空间耦合关系的模型。一些模型构建了概率模型来模拟不同强度洪水下的电网损害(Asaridis et al., 2025),而其他模型则将洪水模型与电力流模拟相结合,以支持短期和长期适应规划(Shukla et al., 2025)。中国东部沿海地区是城市化程度最高、发展最发达的地区之一,面临严重的城市洪水风险,例如2013年10月的宁波洪水(Chan et al., 2024; Fu et al., 2025; Lu et al., 2025)。大量研究量化了农业作物、人口和经济产出(以GDP衡量)受洪水的影响,特别是河流和沿海洪水(Hirabayashi et al., 2021; Rentschler et al., 2022; Smith et al., 2019)。与大规模河流或沿海洪水不同,城市洪水是由强降雨超出城市排水能力引起的。它具有高度局部性、短暂性,并依赖于微观地形。然而,这些特性给基于卫星的检测带来了重大挑战,因为风暴事件伴随的密集云层会遮挡光学传感器,而且洪水的快速发生和消退往往发生在卫星覆盖范围之外。因此,通常用于创建大规模高分辨率洪水地图的卫星数据对于城市洪水来说效果有限。这一基本数据缺口,加上缺乏关于电网的详细信息,给系统评估电网受洪水影响的情况带来了挑战。此外,气候变化情景下城市洪水预测的局限性限制了可靠的未来影响评估。为了解决这些缺口,我们将利用新建立的城市洪水数据集来开发基于机器学习的回归模型,用于城市洪水风险预测。这种方法进一步使我们能够全面评估气候变化情景下中国东部沿海地区未来电网受洪水影响的情况。本文的其余部分安排如下:第2节描述了本研究使用的数据集;第3节概述了估计城市洪水频率(UFF)和评估电网暴露的方法;第4节评估了2040–2050年和2090–2100年多个SSP情景下的中国东部沿海地区的UFF,并分析了相应的电网暴露情况;最后,第5节提出了结论性意见。
2 数据
本研究的研究领域集中在中国东部沿海地区,包括上海、江苏、浙江和福建(见图1a)。这四个省份的电网数据,即电网塔和变电站的坐标,来自中国国家电网公司。我们纳入了Lu等人(2025)提供的2010年至2020年的城市洪水数据,这些数据来自多个来源,包括官方记录、统计年鉴和新闻报道。这些数据记录了城市洪水的位置和时间,空间和时间分辨率分别为城市和日级别。图1b和1c显示了每年的电网数量(PGN)和UFF分布。研究发现,电网主要集中在长江三角洲(YRD)、浙江-福建沿海地区和江苏北部,而城市洪水则频繁发生在YRD和浙江-福建沿海地区。根据支持信息S1中的累积分布函数,高PGN定义为超过400,高UFF定义为超过0.22。图1(在图查看器中打开)显示了研究领域包括上海、江苏、浙江和福建省(绿色阴影部分),长江三角洲用红色框标出。图1b和1c分别展示了(b)电网数量(颜色)和(c)城市洪水频率(点)沿中国东部沿海地区的地理分布。点的大小代表2010–2020年期间的城市洪水次数。数字高程模型(DEM)和坡度数据集的分辨率为1公里,由国家冰冻圈沙漠数据中心提供(Kang, 2020)。如图2a所示,YRD、江苏平原和浙江-福建沿海地区的DEM较低,而浙江南部和福建内陆地区的地形以较高的山地为主,DEM较高。因此,图2b中北部平原和沿海地区的坡度梯度较缓,而南部山区的坡度较陡。图2(在图查看器中打开)展示了2010–2020年期间中国东部沿海地区的(a)数字高程模型、(b)坡度、(c)每年观测到的极端降雨事件频率和(d)观测到的不透水性比率的空间分布。极端降雨事件频率(EREF)来自全球降水测量(GPM)集成多卫星反演产品V6(Huffman et al., 2020),该产品提供了2010年至2020年的0.1°空间分辨率的日降水量。我们将EREF定义为每年降水量超过50毫米的天数。如图2c所示,EREF从南向北、从西向东逐渐减少,最高值出现在浙江和福建的内陆地区。对于未来预测,我们使用了耦合模型比较项目第6阶段(CMIP6)框架中的14个通用环流模型的日降水量输出,这些模型在模拟极端降水方面表现良好(Xu et al., 2022)。这些模拟数据涵盖了历史时期(2010–2020年)和两个未来时期(2040–2050年和2090–2100年),以及三种共享社会经济路径-代表性浓度路径情景(即SSP1-2.6、SSP2-4.5和SSP5-8.5)。这些SSP分别对应低、中和高的温室气体浓度(O’Neill et al., 2016)。为了减少系统偏差,应用了等距累积分布函数方法进行偏差校正(Su et al., 2018; Tian et al., 2021),假设训练期间(即2010–2020年)观测到的降水量与模拟降水量之间的统计差异在未来的时期(即2040–2050年和2090–2010年)保持一致。详细算法在支持信息S1的文本S1中提供,EREF预测结果在支持信息S1的图S2中展示。不透水性比率(IR):观测到的历史土地利用/土地覆盖(LULC)数据分辨率为300米,来自欧洲空间局气候变化倡议(Copernicus Climate Change Service, 2019)。T. Zhang等人(2023b)提供了SSP1-2.6、SSP2-4.5和SSP5-8.5下的未来LULC数据,这些数据考虑了气候和社会经济驱动因素模拟了全球LULC变化。城市化显著影响城市洪水风险(Gu et al., 2019)。由于不透水性是城市化的关键指标(Mehedi et al., 2022; Yang et al., 2013),我们在本研究中引入了IR,定义为每个0.1°网格单元内的不透水表面面积比例。IR值的范围是0到1,较高的值表示更高的城市化程度。如图2d所示,2010–2020年的IR表现出强烈的区域异质性,高值集中在YRD和浙江-福建沿海城市聚集区,如上海。未来IR预测在支持信息S1的图S3中提供。研究表明,城市洪水受气象、地形、地理和其他因素的影响(Bentivoglio et al., 2022)。在本研究中,我们选择DEM、坡度和EREF作为输入特征。这里使用的所有数据列在支持信息S1的表S1中,并重新采样到0.1°的空间域。
3 方法
为了估计未来电网受城市洪水的影响,我们需要首先使用基于随机森林(RF)算法的数据驱动模型来模拟UFF。机器学习模型被广泛用于估计城市洪水(Mehedi et al., 2022)。作为高效的模型,决策树是一种简单、可解释的模型,它根据特征值将数据分成不同的分支,最终在叶节点处得出预测结果。然而,决策树容易过拟合,特别是当树变得太深或者数据集有噪声时。随机森林(RF)通过构建多个决策树的集成来克服这一限制。它确保各个树是多样化的,从而降低了过拟合的风险并提高了泛化能力。RF的最终预测通常是通过平均所有树的预测结果来获得的,对于回归问题,或者对于分类问题,则采用多数投票(Lin等人,2021年)。在这项研究中,我们开发了一个新颖的两阶段RF框架,用于评估城市洪水频率(UFF),该框架使用了多源预测输入特征,包括EREF、IR、DEM和坡度,如图2所示。UFF是该模型中的目标变量,如图1c所示。这种方法首先使用RF分类器来预测城市洪水发生的概率,将UFF > 0的样本分类为洪水事件,将UFF = 0的样本分类为非事件。在此分类之后,使用RF回归器来估计这些已识别风险区域(即UFF > 0的区域)内的具体UFF值。然后,我们将训练好的模型应用于SSPs情景下的特征,这些特征包括图2中的DEM和坡度、支持信息S1中的图S2中的EREF以及支持信息S1中的图S3中的IR。这个两阶段RF模型的整体工作流程在图3中以图形方式进行了说明。这种两阶段架构解决了城市洪水建模中的几个关键挑战。首先,它解决了由于典型数据集中非洪水观测值占主导地位而导致的零膨胀问题。其次,它区分了城市洪水发生的驱动因素和频率决定因素。最后,它有效地捕捉了城市洪水生成机制中的非线性阈值响应。