提出了一种新型集成缺测填补框架,整合了两个互补组成部分:(1) 一种针对在半干旱地区应用欧洲中期天气预报中心第五代陆面再分析数据集(ECMWF Reanalysis 5th Generation Land Component, ERA5-Land)的偏差订正(bias correction)流程;(2) 一种基于机器学习(Machine Learning, ML)的缺测填补系统,利用集成预测建模重建缺失的地面观测数据。所采用的4种统计偏差订正方法总体表现相近;然而,线性缩放(Linear Scaling, LS)在多数站点的大多数指标上持续表现出更高精度。通过对7种ML算法进行评估发现,基于树(tree-based)和提升(boosting)的模型在内陆站点具有更高精度,而线性模型(linear models)在沿海和内陆站点均表现出较强竞争力。这种空间异质性(spatial heterogeneity)凸显了自适应集成选择对于确保气候变量预测稳健性和地理一致性的重要性。针对每个变量构建的投票集成(voting ensemble)ML模型在温度变量预测中表现出较强预测能力,多数站点的决定系数(R2 )持续超过0.9。此外,海平面气压预测在所有站点均表现出极高精度,R2 持续高于0.98。对于露点温度(dew point temperature),内陆气候站点的表现相对较弱,例如 Kharga 和 Dakhla 站点的 R2 分别为0.85和0.87。风速预测最具挑战性,多个站点的 R2 低于0.75,其中 Asyut 表现最弱(R2 = 0.47)。所提出的方法有效解决了长期气象记录中的缺口和不一致问题,生成了1990—2020年埃及13个站点高质量、连续的气候变量时间序列,可为气候变化影响评估、水文建模和农业发展规划提供支持。
该论文发表于《Agricultural Water Management》,围绕数据稀缺半干旱区域长期气象序列缺测严重、再分析资料与地面观测存在系统偏差、从而制约气候变化评估、水文模拟与农业水管理等问题,提出了一套面向埃及多站点日尺度气象数据的缺测填补框架。研究背景在于,中东和北非地区对气候变化高度敏感,但地面气象站网稀疏、历史记录不完整,导致许多研究不得不依赖卫星反演和再分析产品。尽管 ERA5-Land 具备连续、长时序和高分辨率优势,但在气温、湿度和风速等近地面变量上仍可能存在显著偏差,尤其在半干旱、局地微气候明显且观测稀少的区域,这种偏差会进一步传播到蒸散发估算、土壤水分平衡和灌溉调度分析中。因此,开展偏差订正与缺测重建一体化研究具有明确现实需求。
研究人员以埃及13个气象站1990—2020年的日尺度资料为基础,研究6个关键气象变量,即最高气温(Tmax,maximum temperature)、最低气温(Tmin,minimum temperature)、平均气温(Tmean,mean temperature)、露点温度(Tdew,dew point temperature)、风速和海平面气压,同时引入 ERA5-Land 再分析数据作为辅助信息源。研究核心在于将“ERA5-Land 偏差订正”与“机器学习缺测填补”有机衔接:先利用地面观测对 ERA5-Land 进行统计偏差订正,再将订正后的再分析数据与地面观测及时间特征共同输入多种机器学习模型,最终通过投票回归集成(Voting Regressor Ensemble)生成完整连续的气象序列。研究表明,4种偏差订正方法中,线性缩放(LS)在多数站点和变量上表现最佳;机器学习模型方面,内陆站点以树模型和提升模型表现更优,而温度变量在线性模型中也具有较强适用性。总体而言,该框架可稳定重建长期缺测资料,并较好保持季节变化和长期趋势。
从意义上看,该研究为半干旱数据稀缺地区提供了一种可扩展、可操作的气象资料重建技术路线。成果不仅形成了埃及13站1990—2020年连续高质量日尺度气象序列,也为后续气候趋势识别、参考蒸散发(ETo,reference evapotranspiration)估算、水资源管理、农业发展规划和气候适应研究提供了可信基础。论文特别强调,该框架在实际观测缺口条件下完成验证,而非依赖人工构造缺失样本,因此更贴近真实应用场景。
研究人员采用的主要技术方法包括:以埃及13个气象站1990—2020年地面日尺度观测数据和对应坐标提取的 ERA5-Land 日尺度再分析数据为样本来源;首先进行数据预处理,包括缺失识别、异常值剔除、物理阈值约束、年序列与年积日(DOY,day of year)特征构建以及机器学习阶段的 z-score 标准化;随后比较线性缩放(LS)、方差缩放(VS,Variance Scaling)、经验分位数映射(EQM,Empirical Quantile Mapping)和理论分位数映射(TQM,Theoretical Quantile Mapping)4种偏差订正方法;最后构建随机森林(RF)、极端随机树(ET)、梯度提升(GB)、XGBoost(XGB)、线性回归(LR)、Ridge 和 Lasso 等7类模型,采用80:20训练—测试划分与5折交叉验证,按 R
2 、均方根误差(RMSE)和平均绝对误差(MAE)筛选最优模型,并以前三名模型构成投票集成完成缺测重建。
在研究结果部分,论文按照多个小节系统展示了方法性能与数据重建效果。
3.1. Data preprocessing
预处理结果表明,不同站点的缺测程度差异明显,Luxor 仅缺失147天,占研究期1.3%,而 Dabaa 缺失4042天,占35.7%,Farafra 也达到28.1%。这一结果说明研究对象具有显著异质性,适合作为复杂缺测场景下的方法评估样本。质量控制分析显示,Tmax、Tmin 和 Tmean 的异常值很少;Tdew 在部分干旱内陆站点存在中等数量异常值;风速则在多站表现出更高异常值数量,反映出该变量既受仪器敏感性影响,也具有较强物理波动性。研究人员进一步采用 z-score 标准化提升模型数值稳定性,并指出此步骤仅用于机器学习阶段,不影响偏差订正中对原始物理量纲的保持。该部分结果说明,研究首先建立了一个物理合理且统计一致的数据基础。
3.2. Bias correction of ERA5 satellite data
在偏差订正评估中,研究人员比较了 LS、VS、EQM 和 TQM 4种方法在6类气象变量上的表现。结果显示,尽管四者总体接近,但 LS 在多数站点和多数变量上持续获得最低误差。以 Siwa 站为例,LS 在 Tmax、Tmin、Tmean、Tdew、风速和海平面气压上均取得最低 RMSE,显示出较强稳健性。扩展到全部13站后,LS 在 Tmax 和 Tmin 上分别于13站中的11站表现最优,在 Tmean、Tdew、风速和海平面气压上也保持主导地位;VS 在部分局地变量订正中表现出一定优势,而 TQM 与 EQM 整体较弱。该部分说明,在埃及半干旱区域,ERA5-Land 的主要误差形式多表现为均值层面的系统偏差,因此 LS 这一相对简洁的方法即可获得可靠效果。
3.3. Evaluating the performance of ML models
机器学习模型评估部分表明,不同算法在空间上存在明显性能差异。研究人员将偏差订正后的 ERA5-Land 与地面观测、年份及 DOY 共同用于建模,对6类变量分别训练7种机器学习算法,并根据 R
2 选取前三模型组成投票集成。结果显示,XGB、GB、RF 和 ET 等树模型与提升模型在多数变量上占优,尤其在 Asyut、Baharia、Minya 和 Luxor 等内陆站点表现更佳;而 LR、Ridge 和 Lasso 在温度变量上于沿海和内陆站点均有竞争力,但在 Tdew、风速和海平面气压上通常弱于非线性模型。这一结果说明,不同变量和站点的最优模型并不一致,支撑了作者提出的“局地自适应集成选择”策略。
在投票集成模型的具体表现上,Tmax 预测精度很高,多数站点 R
2 > 0.95,Luxor 和 Aswan 达到0.98,而 El Tor 最低为0.89。Tmin 的最高 R
2 出现在 Minya 和 Aswan(0.96),Farafra 最低(0.90)。Tmean 在全部站点上都表现优异,Luxor 和 Aswan 达到0.99,El Tor 也有0.96。Tdew 的预测能力低于其他温度类变量,沿海站点 El-Arish、Ismalia 和 Dabaa 的 R
2 达0.96,而 Kharga 和 Dakhla 分别降至0.85和0.87,说明干旱内陆环境下湿度相关变量更难重建。风速是最难预测的变量,Kharga 和 El Tor 的 R
2 分别为0.79和0.77,但多个站点低于0.75,Asyut 最低,仅为0.47。海平面气压的预测则最稳定,所有站点 R
2 均高于0.98,多个站点达到0.99。作者还指出,在本研究缺失比例不超过36%的条件下,模型性能并未随着缺口比例增加而显著恶化,说明方法对中等程度数据缺失具有较好鲁棒性。
3.4. Assessment of gap-filled data
在缺测填补效果评估中,研究人员使用最优集成模型重建了1990—2020年全部站点的完整日尺度序列。以缺测比例最高的 Dabaa 站为例,重建后的日序列与原始时间变化趋势高度一致,能够保持季节周期和长期变化特征;月平均序列比较同样显示原始观测与填补结果在时间上较好对齐。30年平均值比较进一步显示,除风速外,多数变量的原始均值与填补均值非常接近。温度变量偏差大多控制在 ±1.5% 以内,Tdew 的偏差范围为 −3.8% 至 +1.8%,而海平面气压差异可忽略不计(≤0.01 kPa)。风速偏差相对最大,例如 Dabaa 和 El Tor 表现出较明显正偏差,说明风速重建仍最具不确定性。残差分析显示,Dabaa 站6类变量的预测残差总体以0为中心,温度相关变量的平均误差均小于0.07,分布较窄且近似对称,提示方法未引入明显系统偏差。
3.5. Uncertainty quantification
在不确定性量化部分,研究人员将前三个最优模型预测结果的标准差(σ)定义为集成扩散(ensemble spread),用以衡量重建值的不确定性。以 Aswan 站为例,海平面气压的不确定性最低,平均集成扩散仅0.02 kPa;Tmean 也较低,平均集成扩散为0.35 °C。Tdew 在温度相关变量中不确定性最高,平均集成扩散为0.50 °C,最大可达3.23 °C,反映出湿度类变量对局地大气波动更加敏感。风速虽然平均集成扩散为0.19 m/s,但相对其均值而言仍显示出较大波动,提示局地地形、粗糙度和湍流过程会削弱模型一致性。总体来看,5th–95th 置信区间及 ±2σ 范围均保持在物理合理区间内,说明该集成框架能够提供稳定的概率型重建结果。
讨论部分指出,历史气象资料完整性不足一直是农业水管理和水文模拟的重要瓶颈,而本研究提出的框架通过“先订正、后填补”的思路,提高了再分析数据向地面尺度映射的可靠性。作者认为 ERA5-Land 偏差主要源于近地面观测同化不足、空间分辨率较粗、干旱地表卫星反演误差以及对对流、云微物理和陆气相互作用参数化的局限。针对这些问题,研究结果表明 LS 足以有效处理埃及日尺度 ERA5 数据中的主要均值偏差,而复杂分布映射方法并未展现出明显优势。机器学习部分则显示,局地气候与地理差异决定了模型选择需要因地制宜,统一模型并不适合所有变量和站点。讨论还特别强调,风速和露点温度由于物理机制更复杂、局地性更强,仍需专门化处理。与既有主要比较不同算法性能的研究相比,本文的创新在于先进行 ERA5-Land 统计偏差订正,再将订正结果纳入局地自适应投票集成框架,并使用真实观测缺口而非人工构造缺口进行验证,因此更具实际应用价值。
研究结论部分可概括为:通过将传统统计偏差订正方法与现代集成机器学习技术相结合,本研究构建了一种适用于数据稀缺区域气象时间序列缺测填补的高效、可扩展框架。4种偏差订正方法比较结果总体接近,其中 LS 在多数站点和变量上精度最高,表明埃及日尺度 ERA5 数据的主要偏差来源于均值差异,采用简单的 LS 即可实现稳健有效的偏差订正。机器学习模型表现出明显空间差异:树模型和提升模型在内陆区域更优,线性模型在沿海与内陆站点的温度变量上也具有竞争力,因此有必要采用局地优化后的投票集成方式以获得稳健且地理一致的预测结果。尽管各站缺测比例最高达到36%,模型整体性能仍基本不受影响;原始数据与填补后月平均值的比较进一步证实,该方法能够较好保持季节变化与长期趋势,因此重建数据可用于后续气候趋势分析和敏感性评估。需要指出的是,风速与露点温度在干旱环境下仍具有较高重建难度,未来仍需针对这两类变量开展更具针对性的优化。总体而言,本研究为解决历史气候记录不完整这一长期问题提供了重要进展,并为数据稀缺半干旱地区的气候影响评估、水文建模和农业水管理提供了可靠数据支撑。
打赏