陆地蒸散发(Evapotranspiration, ET)的精准估算对理解全球水循环与能量循环至关重要,然而当前全球尺度的ET估算仍存在显著约束不足的问题。本研究提出一种融合最大熵产生(Maximum Entropy Production, MEP)理论与随机森林(Random Forest, RF)模型的集成框架,以提升全球ET估算精度。与传统RF模型直接估算ET不同,该集成框架(MEP-RF)通过训练RF模型预测MEP模拟ET的误差。验证结果表明,MEP-RF在时空外推能力上显著优于单一RF模型。基于原位观测的归因分析显示,MEP的输入变量——净辐射、植被覆盖度、土壤湿度与地表温度——是控制ET过程的最关键因子。研究人员进一步利用上述四类变量的全球再分析与卫星数据集驱动MEP-RF,得到全球陆地年平均ET为548 mm/年,其中77%来自植被蒸腾。2003–2021年间,全球ET以0.85 mm/(年·年)的速率呈显著上升趋势,其主要驱动因子为植被变绿而非气温升高,而区域尺度ET下降则与土壤湿度降低密切相关。该集成框架无需依赖难以获取且不确定性较高的输入参数(如风速、地表粗糙度、空气动力学阻抗与冠层气孔阻抗),从而为全球ET估算提供了全新路径。MEP-RF可作为独立于现有全球ET产品的替代方法,代表了一种极具潜力的物理机制驱动途径,可纳入地球系统模型以提升水循环与能量循环的模拟能力。
《Water Resources Research》发表的这项研究针对全球陆面蒸散发(Evapotranspiration, ET)估算中长期存在的参数不确定性强、外推能力弱的核心瓶颈,构建了融合最大熵产生(Maximum Entropy Production, MEP)理论与随机森林(Random Forest, RF)的物理-数据混合建模框架。研究背景在于传统Penman-Monteith(PM)等机理模型高度依赖冠层阻抗、空气动力学阻抗、风速及地表粗糙度等难以大范围观测的参数,导致估算不确定性极高;而纯数据驱动的机器学习模型虽拟合能力强,但在站点稀疏区外推时易出现过拟合与系统性高估,尤其难以可靠反映气候变化下的ET响应。为此,研究人员提出了“误差学习”型集成范式MEP-RF:不直接用机器学习拟合ET观测值,而是用RF模型学习MEP物理模型模拟ET的残差规律,从而在保留物理机制约束的同时修正经验参数化偏差。
关键技术方法上,研究首先基于FLUXNET2015通量网的212个站点日尺度观测数据开展模型训练与验证,采用时序分割与空间三折交叉验证评估外推性能。MEP模型仅输入净辐射、地表温度、土壤湿度与植被指数(NDVI),避免了传统模型对阻抗参数的依赖;RF回归模型分别采用11个气象变量与4个MEP输入变量两种配置进行对比。归因分析采用SHapley Additive exPlanations(SHAP)量化变量重要性。全球模拟阶段,MEP-RF驱动数据统一为1°分辨率,涵盖CERES净辐射、MODIS NDVI、GLEAM根区土壤湿度、ERA5-Land雪盖分数等卫星与再分析产品,并与GLEAM、MODIS、FLUXCOM等7套主流全球ET产品进行多维度基准比对。
研究结果部分如下:
3.1 站点尺度模型验证表明,MEP模型整体表现良好,但在不同站点与干湿条件下存在系统性偏差,尤其在水分胁迫较高时因经验性气孔参数化方案的不确定性导致高估。MEP-RF有效修正了这些偏差,其性能优于纯数据驱动的RF模型。
3.2 站点归因分析证实,净辐射、NDVI、地表温度与土壤湿度是ET过程的四大核心驱动因子,而水汽压亏缺(Vapor Pressure Deficit, VPD)、风速与CO2浓度的重要性极低,验证了MEP输入结构的合理性。在MEP-RF中,土壤湿度因直接关联水分胁迫误差而成为最重要的预测因子。
3.3 空间外推交叉验证显示,纯RF模型在训练站点稀疏的区域(如干旱区)出现严重高估,而MEP-RF凭借物理机制的约束,在所有验证组中均保持最优且最稳定的表现,证明误差学习策略显著提升了外推可靠性。
3.4 全球ET估算结果显示,MEP-RF模拟的2003–2014年全球陆地平均ET为548 mm/年,与多套产品的集合均值(532 mm/年)高度一致。空间格局与纬度分布均处于现有产品变幅范围内,且月际动态相关性超过0.97。MEP-RF估算的全球ET中,植被蒸腾占比高达77%,与同位素观测结果吻合,显著高于多数模型估计。
3.5 全球变化趋势分析指出,2003–2021年间全球陆地ET以0.85 mm/(年·年)的速率显著上升。SHAP归因表明,该增长主要由植被变绿(NDVI上升)驱动,尽管同期气温显著升高,但其直接贡献微弱;净辐射在此期间无显著趋势,亦非主要驱动因子。
3.6 区域差异分析揭示,68%的陆地区域ET呈上升趋势,32%呈下降趋势。ET变化主要取决于植被与根区土壤湿度的非线性相互作用:土壤湿度增加伴随植被生长增强的区域ET上升,而土壤干燥区域ET则下降。
讨论部分强调,误差学习框架的核心优势在于将ML模型的学习目标从具有强趋势与复杂非线性的ET本身,转移到波动范围较小且无显著趋势的MEP残差上,从而同时解决了时空外推难题。研究同时指出未来不确定性:CO2浓度升高对气孔导度与ET的生理效应仍存争议,气候暖干化可能加剧区域ET趋势的分异。局限性在于站点尺度观测向网格尺度升尺度的固有偏差,以及MEP-RF可能破坏能量平衡的潜在问题。
结论部分总结为:该研究提出的MEP-RF集成框架突破了传统ET估算对高不确定性阻抗参数的依赖,在空间外推能力与全球估算可靠性上均优于纯数据驱动方法。该框架凭借其物理机制基础与较少的输入需求,为改进地球系统模型与陆面模式中的水热循环模拟提供了强有力的新工具。