Swin-MBUNet用于冬小麦种植中高精度土壤水分预测的模型研究

时间:2026年6月1日
来源:Journal of Agriculture and Food Research

编辑推荐:

摘要:土壤水分(Soil Moisture, SM)是精准灌溉管理中的关键参数,但其时空异质性与非线性动力学特性对精确预测构成显著挑战。现有深度学习方法(含循环网络与卷积架构)难以同时捕捉空间分布式传感器阵列间的长距离依赖关系与各点位特有的时序模式。为解决此问

广告
   X   

摘要:土壤水分(Soil Moisture, SM)是精准灌溉管理中的关键参数,但其时空异质性与非线性动力学特性对精确预测构成显著挑战。现有深度学习方法(含循环网络与卷积架构)难以同时捕捉空间分布式传感器阵列间的长距离依赖关系与各点位特有的时序模式。为解决此问题,研究人员提出Swin-MBUNet——一种融合Swin Transformer编码器(用于从多变量时间序列中提取分层特征)与多分支UNet解码器(用于多尺度时序特征融合)的新型框架。该模型处理多源传感器数据,包括来自3×3空间网格三个深度层的27个土壤水分通道,可实现考虑田间尺度空间变异性的点位特异性预测。基于冬小麦田多源气象与传感器数据训练,该模型在精度、收敛稳定性及含不确定性感知的预测方面均优于基准架构。研究贡献包括:(1)将土壤水分预报构建为带空间分布式传感器网络点位特异性通道的多输出时序预测问题;(2)设计适用于精准农业的混合Swin Transformer–UNet框架;(3)通过实证评估证明该方法可提升预测可靠性并为灌溉决策提供支持。
论文解读:Swin-MBUNet用于冬小麦农田高精度土壤水分预测研究
全球水资源短缺背景下,农业用水占全球淡水提取量约70%,其中小麦作为主要粮食作物对水分供应高度敏感,优化灌溉管理至关重要。精准灌溉依赖实时土壤—气候变量监测,而土壤水分(Soil Moisture, SM)受降雨、蒸发、土壤结构及作物生长等多因素非线性耦合影响,具强时空异质性。现有方法存在三方面局限:一是多数模型基于单点传感器数据,未充分考虑田间多点空间变异性;二是时序模型(如PatchTST、Informer)难同时融合气象、土壤、作物多维信息;三是常规深度学习输出确定性值,缺乏置信区间或不确定性估计,不利于风险导向灌溉决策。高斯过程回归(Gaussian Process Regression, GPR)可提供概率输出但计算复杂度为立方级,不适用于高维多传感器长时序。为此,研究人员开展本研究,提出Swin-MBUNet混合深度学习框架并在成都平原冬小麦田验证,相关成果发表于《Journal of Agriculture and Food Research》。
主要关键技术方法: 研究人员于中国成都平原西华大学北侧冬小麦—水稻轮作试验田(约6公顷,3×3网格布设9个管式土壤水分传感器节点,各测10 cm、30 cm、50 cm三层,共27通道土壤体积含水量Volumetric Water Content, VWC;中心气象站采集气温、相对湿度、风速风向、总辐射、光照度、降雨量、大气压;另测土壤温度、pH及氮磷钾含量,共47维特征,采样间隔30分钟)。数据经线性插值填补缺失值、3σ原则检测异常并用滑动窗口均值修正、Z-score标准化,并加入小麦生育期One-hot编码与日周期正弦—余弦时间特征。构建Swin-MBUNet模型:输入经一维卷积Patch Embedding(核16,步长8,嵌入维度64)转为时序Token;Swin Transformer编码器(窗口大小7,头数4,含Window-based Multi-Head Self-Attention(W-MSA)与Shifted Window策略及Patch Merging下采样)提取分层时序特征;多分支UNet解码器(三支并行卷积:3×3膨胀率d=1、3×3 d=2、5×5 d=1,跳跃连接融合后1×1卷积)恢复分辨率;输出预测均值μ与方差σ²(Softplus激活),损失函数为均方误差(Mean Squared Error, MSE)与负对数似然(Negative Log-Likelihood, NLL)加权组合(λ=0.5)。按冬小麦生育周期划分训练集(2023-10-10至2024-04-29)、验证集(2024-04-29至2024-06-29)与跨季测试集(2024-10-10至2025-06-29),以RMSE、MAE、决定系数R²、相对均方根误差(Relative RMSE, RRMSE)、预测区间覆盖概率(Prediction Interval Coverage Probability, PICP)与平均预测区间宽度(Mean Prediction Interval Width, MPIW)等评价,并与Informer、PatchTST、标准Transformer、U-Net及消融变体对比。
研究结果
2. Dataset and Data Acquisition(数据集与数据采集)
试验田位于成都平原(30°46′43″N, 103°57′40″E,海拔约550 m),亚热带湿润季风气候,冬小麦(品种川农27)免耕直播。27通道SM与20维共享气象—土壤特征构成47维输入。传感器规格详述(土壤水分传感器量程0–100% VWC,±1%典型精度等)。基于Raspberry Pi 4B搭建采集—预处理—云端传输系统,中央气象站符合WMO标准。研究人员由此获取高质量多源同步时序数据集。
3. Data Preprocessing(数据预处理)
原始数据含缺失与噪声。短间隔缺失采用基于训练集统计量的因果线性插值;超出均值±3倍标准差的值视为异常并用窗口大小k=5(±1小时)内非异常点均值替换(因果滑动窗口避免未来信息泄漏);全量特征Z-score标准化(使用训练集μ、σ);加入小麦生育阶段One-hot向量与sin/cos小时周期特征以增强模型捕捉农学周期能力。经处理后数据用于建模。
4. Model Design: Swin-MBUNet(模型设计:Swin-MBUNet)
Swin-MBUNet由Swin Transformer编码器与多分支UNet解码器组成。编码器通过移位窗口自注意力以O(n)线性复杂度建模长程时序依赖,隐式融合27通道间相关性而不显式编码2D空间拓扑;解码器多分支膨胀卷积分别捕获降雨致表层快变、蒸散中期趋势与生育期慢变,跳跃连接保留细节。具体含Patch Embedding将T×47输入映射为约2807个64维Token(每Token代表16时间步,50%重叠);两层Swin Block(W-MSA+Shifted W-MSA,层归一Layer Norm、残差、多层感知机Multilayer Perceptron, MLP);Patch Merging拼接相邻Token并线性投影降维升通道;解码器三层级上采样—多分支卷积—特征拼接—跳跃融合—1×1卷积;最终全连接层输出μ与log σ²,Softplus得σ。损失L = 0.5×MSE + 0.5×NLL。消融实验证实Swin编码器优于CNN,多分支解码优于单路径UNet。
5. Model Evaluation(模型评估)
硬件平台为Intel i9-13900K + NVIDIA RTX 4090,PyTorch 2.0实现。训练200 epoch,AdamW优化器,初始学习率1×10⁻⁴。Swin-MBUNet参数量9.84 M,训练耗时0.30 h,显存0.9 GB。与基线比:Swin-MBUNet达RMSE=0.063、MAE=0.034、R²=0.998(深层50 cm处RRMSE低至1.16%),均优于Swin-UNet(RMSE 0.066)、CNN-MBUNet(0.071)、CNN-Transformer(0.074)。收敛曲线显示Swin-MBUNet置信带最窄,早期epoch MSE降至0.0339,较基线快50%以上。不同dropout(0–0.3)与空间点位下Swin-MBUNet保持R²>0.99且RMSE波动最小,具强鲁棒性。PatchTST因通道独立假设难建模跨变量交互致精度偏低,Informer次之。
6. Prediction Results Analysis(预测结果分析)
引入MSE–NLL损失后模型输出μ±σ。预测—观测散点沿对角线分布,R² 0.975–0.994(p<0.001)。误差近似对称(均值–0.0023,标准差0.356),随深度增加误差减小(表层σ_error≈0.492,深层≈0.155),深层RMSE最低至0.099(SM93),表层最高0.650(SM21,低洼黏土地)。空间热图显示深层平均精度99.81%。不确定性校准可靠:平均PICP=99.93%(目标95%),平均MPIW=2.79% VWC;预测σ与绝对误差Spearman相关显著(10 cm层ρ=0.460,p<10⁻⁵),表层σ均值(0.755)>中层>深层(0.369),符合物理认知。区间评分(Interval Score)表明自适应区间较固定宽度降低约57%罚分。时序列对比显示模型良好跟踪各层SM动态,置信区间覆盖实测值。
讨论与结论翻译
研究人员提出并验证了Swin-MBUNet——一种融合Swin Transformer窗口自注意力(多通道时序特征提取)与多分支卷积解码(多尺度时序动态建模)的混合深度学习架构,通过概率输出层提供不确定性感知的高精度土壤水分预测,解决了现有模型在空间分布式预测目标覆盖不足和多源数据融合不充分的问题。基于中国成都平原冬小麦田47维多源数据集,Swin-MBUNet在27个传感器点位及10 cm、30 cm、50 cm各层深度上表现优越,相比Informer、PatchTST、Transformer及U-Net等基准模型取得最低MAE(低至0.034)、RMSE(低至0.063)及R²>0.997,且具快速收敛与深层更高可预测性。不确定性量化预测区间覆盖概率高、区间宽度合理,支持风险知情型精准农业应用。局限性为仅在单一站点验证且未显式编码传感器空间拓扑。未来将通过迁移学习与域适应提升跨场景泛化性,并引入图神经网络(Graph Neural Network, GNN)显式建模传感器间距加权的空间拓扑关系以进一步降低空间异质性强的点位误差。

生物通微信公众号
微信
新浪微博


生物通 版权所有