基于区域特征纯化对比学习的小麦生物胁迫检测：提升病害分类准确性与泛化能力的新策略

时间：2025年10月15日

来源：Frontiers in Plant Science

编辑推荐：

本综述提出了一种基于区域特征纯化对比学习（Regional Feature Purification Contrastive Learning）的小麦病害自动分类框架，创新性地结合无监督表示学习与标签互信息最大化（Mutual Information Maximization）技术。通过W-Paste数据增强方法提升模型对输入扰动的鲁棒性，并设计特征纯化编码器（Feature Purification Encoder）通过反向学习消除特征干扰，在公开数据集上达到98.01%的平均分类准确率，为智能农业中的小麦病害早期诊断提供了新颖而实用的解决方案。

1 Introduction

农业作为社会的基础产业，支撑着全球数十亿人的生计。随着世界人口的持续增长，保障稳定安全的粮食供应变得愈发重要。小麦作为关键谷物作物，与人类生活和发展密切相关，全球年人均消费量超过50公斤的国家达102个。然而小麦植株极易感染多种病害，每年因病毒和细菌性疾病造成的作物损失严重，主要小麦生产国的潜在产量下降幅度可达45%-100%。常见病害如锈病（Rust）、白粉病（Powdery Mildew）、黑穗病（Smut）和赤霉病（Fusarium Head Blight）对农业生产构成严重威胁。

传统的小麦病害检测依赖人工田间评估，这种方法耗时耗力且需要专业技能，往往导致大规模疫情中的响应延迟。近年来人工智能的突破使深度学习成为农业病害识别的变革性工具，在较低成本下实现了显著准确性。现有研究包括Jiang等（2022）对七种经典卷积神经网络的评估，Inception-v3模型在测试数据集上达到92.5%的识别准确率；Li等（2023b）提出的PMVT模型在小麦、咖啡和水稻数据集上分别达到93.6%、85.4%和93.1%的识别率；Alharbi等（2023）基于EfficientNet的少样本学习模型实现了93.19%的分类准确率。

然而现有方法仍存在明显局限：许多现代方法的有效性严重依赖训练数据集的质量、多样性和代表性，限制了其对未知病害模式的预测能力。集成模型的使用显著增加了系统复杂性和计算时间。实际小麦叶片图像常受到复杂背景、不利天气条件、焦点模糊、遮挡和无关物体的影响，导致类间差异小而类内变化大。注意力机制在激活判别性特征时经常误识别模糊的周边信息，导致小麦叶片病害相关区域定位不准确。

2 Method

本研究提出了一种两阶段架构的自动化小麦病害诊断方法。首先使用W-Paste技术对输入数据进行两次处理，从同一批次生成两个独特视图作为正样本。这种方法模拟真实样本并引入微小语义变化，提高网络在新数据分布上的泛化能力。随后通过特征纯化编码器生成2048维归一化嵌入，并通过投影网络传输，在测试阶段移除该网络。监督对比损失使用投影网络的输出计算。为进行训练后分类，固定编码器并在其上训练线性分类器。

2.1 W-Paste

针对实际环境中小麦田间照片的复杂性，以及许多病害症状尺寸小、不同病害外观相似等挑战，采用W-Paste技术模拟真实世界中复杂的小麦叶片病害情况生成正样本。该方法随机消除样本中的两个小矩形区域（使用15×15补丁），并用其他样本的片段填充这些区域以提供多样的语义扰动。生成的样本高度模拟真实小麦叶片病害，显著提高了样本复杂性，增强了模型的泛化能力。

2.2 Feature cleansing encoder

神经网络层在特征学习能力上存在显著差异：低级特征通常包含大量噪声，而高级语义特征表现出更强的判别能力。尽管CNN在特征表示方面具有令人印象深刻的能力，但其在定位不确定区域方面的准确性仍然不足。特征纯化编码器采用包含五个残差块的结构，在前两个残差块处实施干扰特征过滤模块以细化特征。

干扰特征过滤模块包含注意力模块和特征减法模块。对于输入特征X，首先通过注意力模块增强干扰特征。注意力架构首先沿通道维度将输入特征X分成四个子空间，使用1×1、3×3、5×5和7×7的卷积核从每个子空间提取特征。这种分割技术促进了输入张量在多尺度上的并行处理，生成适合每种核类型的特征图。每个片段独立捕获多尺度空间信息，从而建立局部跨通道交互。

随后对每组特征图执行全局平均池化和全局最大池化操作，沿通道维度连接（如公式1-4所示）。捕获的干扰特征从中级特征（第三残差块和第四残差块）中减去，以去除不相关或混淆的局部信息（如公式5-6所示）。

2.3 Projection network

配置了一个包含2,048个神经元的隐藏层和256维输出向量的多层感知器。采用Tian等（2020）提出的自监督对比学习方法类似技术，将网络输出归一化到单位超球面上，允许使用内积来测量投影空间内的距离。与典型的自监督对比训练一样，对比训练阶段后丢弃投影网络，因此测试模型中的总参数数量不受影响。

2.4 Classification network

在完成对比学习的初始阶段后，进入后续步骤：固定编码器并开发线性分类器作为尿沉渣分类层。随后通过仅训练20个epoch来完善小麦叶片病害分类模型。

2.5 Supervised contrastive losses

通过使用SupCon制定监督对比学习损失函数，可以协调全监督学习（SL）与自监督学习（SSL）。SupCon的主要目标是减少正样本之间的距离，这些样本属于同一类别。使用对比损失函数来实现这一目的，该函数经过精心设计以同时考虑正负配对。

损失函数鼓励模型在归一化特征空间中增强不同类别之间的区分。这种方法使模型能够识别同一类别实例之间的共享特征，同时表现出区分其他类别差异的卓越能力。SupCon损失函数由以下公式表示（公式7）：

L^sup = ∑_i∈I -1/|P(i)| ∑_p∈P(i) log exp(z_i·z_p/τ) / ∑_a∈A(i) exp(z_i·z_a/τ)

其中P(i) ≡ {p ∈ A(i): ỹ_p = ỹ_i}是多视图批次中不同于i的所有正样本索引集合，|P(i)|是其基数。该损失函数具有以下理想特性：监督损失促使编码器为同一类别的所有条目提供紧密对齐的表示，改善表示空间聚类；更多负样本增加对比度；具备内部硬正负样本挖掘能力。

3 Experiments and results

3.1 Dataset

使用两个公共数据集进行评估："小麦病害检测数据集"包含三类（褐锈病、健康和黄锈病），共3,679张图像；"小麦植物病害数据集"包含14,154张小麦叶片图像，分为15个独特类别：蚜虫、黑锈病、瘟病、褐锈病、普通根腐病、赤霉病、健康、叶枯病、霉病、螨虫、Septoria、黑穗病、茎蝇、褐斑病和黄锈病。数据集按7:2:1的比例分为训练集、验证集和测试集。

3.2 Experimental settings

在RTX3090 GPU上进行实验。在第一阶段训练中，批量大小设置为8，训练200个epoch。同时，在15个epoch后，将特征减法模块中的干扰特征减法操作替换为加法操作。在第二阶段训练中，使用交叉熵损失函数更新网络。

3.3 Experimental results

为验证所提出方法在利用标签信息方面的有效性，在两个公共数据集上对经典卷积网络、Transformer架构和无监督对比学习进行了比较分析。监督学习通过标签引导学习显著增强了模型性能，在多个评估指标上取得了优异结果。监督对比学习方法在施加严格约束方面表现出显著有效性，实现了更精确的小麦病害特征表征，显著提高了分类性能。

实验结果显示，卷积网络在类别多样性较大的数据集上局部归纳能力较弱，这是由于缺乏突出特征。此外，池化过程减少了细粒度信息，忽略了局部和全局上下文之间的联系，从而限制了网络适当表示特征的能力。Swin-Transformer通过更有效地编码位置信息和管理全局依赖关系，性能优于ResNet50。

所提出的方法在初步训练阶段通过消除阻碍清晰度的无关特征来保留关键信息。无监督对比学习表现出对图像质量和数量的显著依赖性，对正样本配对的生成特别敏感。该方法增强了类内正对的生成，减少了表示空间中同类样本之间的距离，从而促进了关键特征的准确提取和聚合。即使数据有限，也能更有效地利用标签信息创建大量正对，并在小麦病害分类中精确表示复杂图像特征。

通过研究监督对比学习中多种图像增强技术生成正样本对的影响，发现通过随机图像裁剪和特征遮挡生成正对可能导致局部异常，从而增强模型的泛化能力。结果一致表明提出的W-Paste方法优于其他增强技术，该方法提高了模型对特定小麦病害区域的关注度，从而增强了识别分布外病例的能力。

与现有最先进小麦病害分类技术的比较评估表明，虽然多种算法通过注意力机制增强特征提取，但这些机制常常忽略小麦病害的关键属性，从而限制了分类效果。相比之下，该方法强调干扰特征的早期收集，这在处理具有低对比度和复杂背景的真实小麦图像时尤为关键。通过识别和分析这些冗余特征，在特征提取的早期阶段有效去除多余信息，确保模型关注最显著的低级特征。此外，标签信息的加入强化了每种条件下特征空间中的地理约束。结合新颖的W-Paste技术生成正样本对，显著增强了自动化小麦病害诊断的泛化能力，并保证了强大的特征一致性。

对15类小麦病害的详细分类结果显示，混淆矩阵提供了对所提出技术分类有效性的深入见解。从最后一层提取特征并使用t-SNE将其压缩为二维向量的可视化清楚地展示了显著的类间距离和紧密的类内分布，突出了该方法在增强类间分离同时最小化类内波动方面的有效性。这一发现进一步证明了模型准确关注不同类别交界处样本的能力，显著降低了误分类率。

4 Discussion

小麦病害的自动分类在农业中至关重要，可显著提高检测效率和准确性，标准化病害监测，并促进作物健康问题的早期识别。小麦病害检查为了解作物生长条件提供了必要信息。植物健康的变化——特别是锈病、白粉病和黑穗病等病害的流行和严重程度——作为作物病理状况的直接指标。在种植期间定期监测疾病进展，能够精确评估作物健康和生产力的影响，为农民提供调整种植策略的关键见解。

自动化小麦病害分析技术产生可靠而精确的数据，最大限度地减少了人工评估相关的错误和主观性，从而提高了早期检测的敏感性和特异性。这些技术提供小麦病害的快速诊断，确保在病情恶化之前及时干预。因此，开发和执行全面的自动化小麦病害分析系统在提高早期病害检测率、优化作物管理策略以及推进农业诊断的智能化和效率方面具有重要的实际意义。

本研究通过区域特征纯化对比学习提出了一种自动化小麦叶片病害识别方法。在图像特征提取过程中，采用无监督表示学习来优化不同数据间的互信息，同时应用图像分类标签的互信息最大化。该方法通过引入额外的标签信息，对自监督对比学习实施了改进的局部约束。

为增强小麦叶片病害的语义多样性，放大了监督对比学习以建立强大的特征一致性，并提高模型在分布外检测中的效能。设计了W-Paste方法来生成肯定案例，模拟有关多种小麦叶片病害类型的真实情况，从而增强模型对输入变化的鲁棒性及其分布外检测能力。

为深入研究小麦叶片病害的语义表示，开发了特征纯化编码器。在训练的早期阶段，采用反向学习从低级特征中去除多余信息，通过减少中间特征的噪声来隔离最显著的质量，并整合高级语义特征。这种分层方法显著增强了模型在识别分布外实例方面的有效性。

4.1 Limitations of study

尽管技术产生了有希望的结果，但仍存在某些局限性。虽然W-Paste增强在一定程度上改善了模型的泛化能力，但在处理非常复杂的病害样本时，其有效性可能仍然受限。当前方法严重依赖标签信息的准确性和可用性，这在某些情况下可能会削弱模型的鲁棒性。最终，尽管在公共数据集上获得了出色的分类结果，但实际应用中的环境变化和图像质量可能会影响模型的有效性。

4.2 Future works

为提高模型的泛化能力，建议开发更大更多样化的数据集，包含来自不同地理位置和气候条件的小麦病害图像。此外，应用半监督学习方法可以利用未标记数据，增强在标记实例较少的情况下的模型有效性。同时使用标记和未标记数据将改善小麦病害的特征提取。未来研究应专注于改进特征提取技术，以更有效地区分相似病害。检查自注意过程在特征提取过程中的应用可以增强模型对关键特征的关注。

在研究的最后阶段，评估模型在实际应用中的有效性和鲁棒性至关重要。与农民和农业专家合作评估模型在许多农业环境中的表现，并获得进一步改进的反馈将至关重要。确保模型在实际情况下提供准确可靠诊断的能力，将标志着促进其实际应用的重要进展。

5 Conclusion

小麦病害检测一直是农业病害预测中的一个重要问题。自动化小麦病害分类在当代农业中至关重要，显著提高检测效率和准确性，同时促进病害监测的标准化，从而实现作物健康问题的早期诊断。建议的方法利用区域特征纯化对比学习，将无监督表示学习与标签互信息最大化相结合，显著提高了小麦叶片病害的特征提取和分类效能。W-Paste方法的实施增强了模型处理输入扰动的能力，从而增强了其分布外检测能力。同时开发的特征纯化编码器增强了特征一致性，显著提高了分类准确性。

实验结果表明，方法在公共数据集上获得了 exceptional 的分类准确性，证实了其在复杂情况下的效力和韧性。这项研究为小麦病害的自动识别提供了一种实用方法，为智能农业的发展奠定了基础。模型和方法的持续改进预计将在未来小麦病害的早期检测和准确诊断方面取得更大进展。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部