研究人员针对作物残茬覆盖度(CRC)监测中传统地面调查耗时耗力、多光谱遥感难以捕捉秸秆纤维素与木质素短波红外吸收特征的问题,提出了一种融合物理模拟与深度迁移学习的混合框架。研究首先采用线性光谱混合模型(LSMM)模拟不同CRC梯度下的土壤-残茬混合光谱,预训练长短期记忆网络(LSTM);随后利用ZY1-02D高光谱卫星数据及原位测量值对模型进行微调。结果表明,经标准正态变量(SNV)预处理后,微调LSTM模型精度最高(R2=0.84,RMSE=0.12),显著优于偏最小二乘回归(PLSR)、随机森林(RF)及未引入物理先验的直接训练LSTM。通过SHapley加性解释(SHAP)与排列特征重要性(PFI)分析,识别出1778 nm、1980 nm、2216 nm等关键波段,这些波段与残茬生化组分吸收特征吻合,验证了模型决策的物理合理性。该研究为黑土区保护性耕作监测提供了可扩展的高精度遥感方案。
研究背景与意义
作物残茬覆盖度(CRC)指收获后遗留于地表秸秆占土壤表面的比例,是维持土壤肥力、抑制侵蚀、评估保护性耕作的核心指标。传统地面调查难以满足大尺度监测需求。多光谱卫星因短波红外(SWIR)波段宽度不足,难以区分秸秆纤维素与木质素的诊断性吸收特征(2100 nm、2300 nm附近)。中国ZY1-02D卫星虽具备30 m空间分辨率与166个高光谱波段(SWIR光谱采样间隔20 nm),但其农业应用尚未深入。现有反演方法存在局限:光谱混合分析(SMA)受端元变异性影响;纯数据驱动模型依赖大量标注样本且泛化性弱;物理模型模拟与真实观测间存在偏差。此外,深度学习模型常被视为“黑箱”,缺乏机理解释性。为此,研究人员提出一种可解释的混合物理驱动深度迁移学习框架,旨在提升ZY1-02D数据在CRC估算中的精度与可解释性。
关键技术方法
研究选取东北松嫩平原榆树市与梨树县为研究区,采集2021年与2023年两个时期原位CRC数据(共249个样点),通过无人机RGB影像结合随机森林分类提取CRC真值。ZY1-02D高光谱数据经辐射定标、大气校正及噪声波段剔除,采用一阶导数(FD)、对数一阶导数(FLD)、倒数对数一阶导数(FDRL)及标准正态变量(SNV)进行组合预处理。核心技术包括:1) 基于线性光谱混合模型(LSMM)融合77个玉米残茬与7类黑土光谱,生成27,489组模拟数据集;2) 构建三层LSTM网络,在模拟数据上预训练后冻结卷积层,仅用少量实测数据微调全连接层;3) 采用SHAP与排列特征重要性(PFI)量化波段贡献度;4) 设置PLSR、RF及纯数据驱动LSTM作为基准模型,对比全波段与LASSO/CARS特征选择策略下的性能。
研究结果
3.1 ZY1-02D光谱预处理及其与LSMM模拟光谱对比分析
原始ZY1-02D反射率曲线在SWIR区域存在明显噪声。导数变换(尤其FDRL_SNV)显著增强CRC相关吸收特征(如2100 nm、2300 nm)。LSMM模拟光谱与卫星实测光谱在SWIR区域(1400–2500 nm)呈现高度一致的相关性变化趋势(相关系数达±0.9),证实物理模拟可有效表征真实光谱机制。
3.2 数据驱动方法估算CRC的性能
纯数据驱动模型中,随机森林(RF)表现最优。经FDRL_SNV预处理后,LASSO特征选择使RF精度达R2 =0.79、RMSE=0.13、RPD=2.28。PLSR与LSTM在特征选择后亦有提升,但受限于样本量,LSTM未显现显著优势。
3.3 微调LSTM估算CRC的性能与可解释性
预训练LSTM在模拟数据上R2 达0.99。经实测数据微调后,FLD_SNV预处理下模型精度最优(R2 =0.84,RMSE=0.12,RPD=2.53),较基准模型提升显著。SHAP与PFI分析共同识别出1778 nm、1980 nm、2216 nm、2249 nm等关键波段,其物理机制对应纤维素与木质素的C-H、O-H键合振动吸收。851 nm波段呈正贡献,反映残茬多孔结构导致的近红外散射增强效应。
3.4 梨树县CRC制图结果与已发表成果的墙对墙对比
将2021年微调模型反演的梨树县CRC空间分布与Sentinel-2数据估算结果对比,二者空间格局一致(R=0.74),验证了本框架的区域适用性。
3.5 基于微调LSTM的榆树市CRC制图
2023年榆树市85%耕地CRC超过0.6,仅2%低于0.3,符合东北黑土保护性耕作政策实施后的预期覆盖水平。
讨论与结论
光谱预处理中,导数变换消除基线漂移,SNV抑制散射噪声,二者协同提升模型稳定性。LASSO因凸优化特性较CARS保留更多协同特征,故特征选择效果更优。纯数据驱动模型中RF因集成学习机制在小样本下泛化性最强,而LSTM需充足数据支撑其长序列依赖建模能力。本研究提出的物理信息深度迁移学习框架,通过模拟数据预训练习得通用光谱规律,再以少量实测数据微调适应真实场景,有效解决了小样本下深度学习过拟合问题,并借助SHAP/PFI赋予模型物理可解释性。
局限性在于:LSMM未考虑残茬分解过程中的生化组分变化;端元类型局限于玉米与黑土;线性混合假设难以完全刻画复杂冠层散射。未来需融合三维辐射传输模型(如LESS)以增强异质性场景模拟能力。
结论
研究人员成功构建了融合ZY1-02D高光谱数据与可解释深度迁移学习的CRC估算框架。该框架通过线性光谱混合模型生成大规模模拟数据集预训练LSTM,结合有限实测数据微调,实现了R2 =0.84的高精度反演。模型解释性分析证实其对SWIR区域秸秆生化吸收特征的敏感性,为东北黑土区保护性耕作监测提供了可靠技术手段,发表于《International Soil and Water Conservation Research》。
打赏