面向干旱灌溉区县域尺度玉米产量的物理引导深度学习框架

时间：2026年5月15日

来源：Smart Agricultural Technology

编辑推荐：

针对干旱灌溉区县域尺度玉米产量估算中产量—环境关系高度非平稳、灌溉削弱作物水分状况与气象强迫耦合关系的难题，研究人员提出了一种混合物理引导深度学习（Physics-Guided Deep Learning, PGDL）框架。该框架将可微分生物量生产路径与数据驱

针对干旱灌溉区县域尺度玉米产量估算中产量—环境关系高度非平稳、灌溉削弱作物水分状况与气象强迫耦合关系的难题，研究人员提出了一种混合物理引导深度学习（Physics-Guided Deep Learning, PGDL）框架。该框架将可微分生物量生产路径与数据驱动残差校正模块耦合，把农艺过程知识直接嵌入学习架构以提升精度与可解释性。研究选取中国西北新疆地区（2000–2023年）为案例区，其长期县域产量记录与灌溉实践空间异质性显著。模型输入融合ERA5-Land日尺度气象驱动因子（气温、降水、水汽压亏缺VPD、光合有效辐射PAR）、MODIS衍生冠层指标（归一化植被指数NDVI、增强型植被指数EVI、叶面积指数LAI、光合有效辐射吸收比例FPAR及MCD12Q2物候）、MOD11A2热红外覆膜指数、OpenLandMap静态土壤属性及NASADEM地形数据；年度玉米分布掩膜源自Landsat 5/7/8/9 Collection 2影像。研究人员将PGDL与多元线性回归（Multiple Linear Regression, MLR）、随机森林（Random Forest, RF）、极端梯度提升（eXtreme Gradient Boosting, XGBoost）及CNN–LSTM网络对比，后者涵盖从线性、树基到深度序列模型的递进基线。在严格的时间外推检验（2022–2023年）中，PGDL泛化性能最优（R2 = 0.74，RMSE = 1091.9 kg ha−1，MAE = 816.6 kg ha−1），较所有基线RMSE降低11.8%–29.5%，MAE降低10.7%–28.2%。灌溉代理消融实验表明，显式灌溉信息主要贡献于纯物理路径（2022年ΔR2最高达0.031），而在完整模型中边际贡献可忽略（|ΔR2| ≤ 0.001）。学习得到的生理参数呈现连贯空间结构，地理时空加权回归（Geographically and Temporally Weighted Regression, GTWR）揭示物理分量与残差分量的相对贡献存在系统性空间差异，划分出物理主导与数据驱动主导区域。结果表明，该框架提升了管理密集型干旱系统县域尺度产量制图的精度、跨年稳健性与可解释性。

研究背景方面，玉米是全球最重要的主粮作物之一，在粮食安全、畜牧饲料与农业产业中占据核心地位。在干旱半干旱区，玉米产量对气象与管理措施的交互作用极为敏感，灌溉调度、地下水可获得性及灌溉效率可在降雨之外强烈调节作物水分状况。气候变化背景下频发的极端高温与干旱进一步扰动产量形成。这类挑战在以新疆为代表的绿洲农业区尤为突出：水资源持续短缺、土壤类型多样、地形复杂，导致产量—环境关系的非线性与空间异质性加剧。可靠的县域尺度玉米估产对粮食安全规划、水资源配置与农业风险管理至关重要。传统统计年鉴数据存在发布滞后、样点稀疏与空间代表性不一致的问题，而地球观测（Earth Observation, EO）技术虽可提供大尺度连续冠层动态与环境胁迫监测，但在灌溉削弱气候强迫、相似植被指数轨迹对应不同产量结果的干旱灌溉系统中，长时序EO信号向准确产量的转化仍具挑战。现有方法各有局限：统计回归透明高效但非线性刻画能力不足，对非平稳性与多重共线性敏感；过程作物模型（如WOFOST、DSSAT、AquaCrop）机理可解释性强，但需大量校准与管理输入，存在参数异因同效（equifinality）与迁移性差的问题；遥感驱动的光能利用率（Light-Use Efficiency, LUE）模型提供了冠层状态与生物量增长间的物理联系，但其胁迫函数与参数常被假定为空间均一，难以反映管理密集型灌溉系统的复杂性；机器学习（Machine Learning, ML）与深度学习（Deep Learning, DL）方法（如RF、XGBoost、CNN–LSTM）可挖掘高维EO–气象数据特征提升精度，但依赖大数据、易在分布偏移下过拟合，且普遍缺乏物理可解释性。当前干旱灌溉区估产仍存在两大缺口：一是产量—环境关系具有强时空非平稳性，不同县区土壤、灌溉设施与种植实践的差异导致其对高温、VPD与土壤水分亏缺的响应不同，单一全局模型难以适用；二是纯数据驱动黑箱模型缺乏机制一致性与可解释性，限制了其在前所未有的气候情景下的外推可靠性。为此，研究人员提出一种将可微分LUE生物量路径嵌入深度神经架构的混合PGDL框架，旨在实现高精度与生物物理一致性并存、显式表征空间异质性与管理驱动的非平稳性，并提供可链接胁迫驱动因子与空间误差模式的解释性诊断。该研究发表于《Smart Agricultural Technology》。

关键技术方法方面，研究人员以新疆88个县2000–2023年统计年鉴产量为监督目标，基于Google Earth Engine平台融合多源遥感与气象数据，采用Landsat时序影像结合物候阈值法构建年度玉米分布掩膜，并通过双逻辑曲线拟合提取物候期。框架核心包含解耦深度路径网络（Decoupled Deep Pathway Network, DPN）、可微分物理层与物理适配器（Phys-Adapter）：DPN采用门控循环单元（Gated Recurrent Unit, GRU）与时态多层感知机（Multi-Layer Perceptron, MLP）分别编码动态与静态特征，输出生理参数与残差项；可微分物理层内嵌简化Monteith LUE公式，将光能利用率衰减项、灌溉校正水平衡模型与生物量累积过程表达为可微算子，支持梯度端到端传播；Phys-Adapter通过两阶段校准策略（先冻结DPN优化线性缩放系数，再联合训练）防止“物理消失”现象。研究人员构建了静态灌溉代理（Irrigation Proxy, I_proxy）作为物理层水分胁迫项的约束，并引入空间滞后特征与复合损失函数（含MSE损失、生物量单调性惩罚、生理参数正则化与物理分量对齐损失）提升稳健性。模型采用时间外推验证（2000–2021年训练，2022–2023年独立测试），并以地理时空加权回归（GTWR）作为事后诊断工具解析物理与残差分量的空间贡献。

研究结果方面，模型性能比较显示，PGDL在独立测试年表现最优，R²达0.735，RMSE为1091.9 kg ha⁻¹，MAE为816.6 kg ha⁻¹，较CNN–LSTM、RF、XGBoost与MLR的R²分别提升0.092、0.076、0.168与0.268，RMSE分别降低11.8%、13.9%、21.7%与29.5%，且训练–验证差距最小，有效缓解了树基与深度模型的过拟合问题。观测–预测散点图与残差分布表明，PGDL预测值紧密围绕1:1线，残差近似对称且异方差性弱，边际密度最接近实测分布。

灌溉代理消融研究表明，显式灌溉信息主要提升纯物理路径性能（2022年R²提升0.031，RMSE降低50.7 kg ha⁻¹），但在完整PGDL中边际贡献可忽略（|ΔR²| ≤ 0.001），说明残差校正模块已从EO时序特征中隐式吸收了灌溉信号，体现了框架内各组件的角色分工。

产量水平相对误差分布显示，PGDL在各产量分组中误差分布最集中且接近零值，低产组无显著高估或低估偏倚，高产组虽有普遍低估趋势，但离散度最低，优于基线模型。

2022–2023年PGDL估产空间格局显示，高产区集中于北疆西北部农业带，低产区位于南疆西南部，两年模式高度一致；相对误差空间分布中，PGDL的大幅偏差呈局部斑块状，而基线模型则呈现大面积连片偏倚，证明PGDL有效降低了空间结构性误差。

空间学习生理参数与胁迫响应结果显示，最大光能利用率ε_max（2.4–3.4 gC MJ⁻¹）、收获指数HI（0.40–0.47）、土壤持水量W_crit（99–110 mm）与VPD敏感系数k_vpd（0.35–0.78）均呈现与农情认知相符的空间分异；VPD响应函数表明高k_vpd区域在中高VPD下胁迫惩罚更强；生育期内平均土壤水分因子f_SW迅速升至近1.0并保持，而VPD因子f_VPD持续偏低，说明灌溉满足根区水分需求后，大气干旱成为主要限制因子，且2022年VPD胁迫重于2023年。

GTWR空间解释结果显示，物理分量系数β_phys在北疆最高（1.1–1.3），南疆西部最低（0.6–0.7）；残差分量系数β_res在西、北部较高（0.55–0.60），东、中部较低（0.25–0.35），清晰划分出物理主导与数据驱动主导区域，反映了不同 agro-ecological 背景下机制解释力的差异。

讨论与结论部分，研究人员指出灌溉代理主要改善物理路径的原因在于其弥补了纯气候驱动水分胁迫项在灌溉区的系统性偏差，而残差模块因已摄入灌溉影响的EO时序特征，使静态代理边际贡献有限。物理层虽存在参数异因同效的挑战，但学习参数的空间连贯性与GTWR揭示的贡献分区表明其并非装饰性组件，未来可通过中间变量（如蒸散发、土壤水分、生物量）的独立验证进一步提升可证伪性。研究严格区分了Oracle-Lag（回溯上限）与Predicted-Lag（业务部署）两种空间滞后模式，并采用训练集统计量标准化，避免了时间泄露与捷径学习。2022年作为更难测试年的表现与VPD胁迫诊断一致，解释了高产组低估源于损失函数偏向中产密集区、高产县样本不足及树基模型预测截断效应，而PGDL通过空间变异性生理参数缓解了这一问题。局限性包括灌溉代理静态粗糙、物理层可辨识性待加强、空间邻域未考虑地形屏障及未纳入极端高温、养分、盐分、病虫害等胁迫过程。未来工作应融合动态灌溉信息、多任务约束中间状态、改进空间邻域定义并扩展物理过程模块。

结论明确，该PGDL框架在新疆案例中实现了高精度、强跨年稳健性与高可解释性的县域玉米估产，证实了其适用于管理密集型干旱灌溉系统的潜力。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部