** 在农业生产的大舞台上,精准识别作物类型就像一把精准的 “手术刀”,对于农业监测、产量预估、资源合理分配以及经济发展战略的制定都至关重要。近年来,高光谱成像(HSI)技术凭借其能获取丰富光谱和空间信息的优势,成为遥感数据分析领域的 “新宠”,在作物精细分类、植物病害检测等多个方面展现出巨大潜力。
然而,传统的 HSI 分类方法却存在诸多 “短板”。早期的方法往往只关注光谱信息,忽视了像素间的空间关联,导致分类时丢失了重要的空间特征;后来一些利用空间特征的方法,又没能充分挖掘光谱维度的信息。深度学习方法的出现,虽然带来了新的希望,但也面临着各自的问题。比如,基于卷积神经网络(CNN)的方法受限于卷积核的感受野,难以捕捉长距离依赖关系;视觉 Transformer(ViT)虽能捕获长距离依赖,但在提取局部特征方面表现欠佳。而且,现有的结合 CNN 和 ViT 的方法,在特征融合上不够灵活,在复杂场景下的细粒度分类能力不足。在这样的背景下,为了突破这些困境,甘肃农业大学机电工程学院等研究机构的研究人员开展了深入研究。
研究人员提出了一种名为 CMTNet(Convolutional Meets Transformer Network)的创新深度学习框架,旨在实现基于无人机(UAV)的高光谱作物精准分类。相关研究成果发表在《Scientific Reports》上。
研究人员在这项研究中运用了多种关键技术方法。首先,采用公开的 HSI 数据集,如来自武汉大学的 WHU-Hi 系列数据集,包括 WHU-Hi-LongKou、WHU-Hi-HanChuan 和 WHU-Hi-HongHu 数据集,这些数据集包含不同地区、不同土地覆盖类型的高光谱影像数据。其次,构建了 CMTNet 网络模型,该模型由光谱 - 空间特征提取模块、局部 - 全局特征提取模块和多输出约束模块组成。在实验过程中,利用服务器配备的硬件资源和相关软件平台进行模型训练和测试,并通过多次重复实验取平均值来减少随机因素的影响。
下面来看具体的研究结果:
- 数据集与实验设置:使用的 WHU-Hi 系列数据集来自中国湖北省江汉平原,涵盖多种作物类型。每个数据集按一定比例划分为训练集和测试集。实验在特定服务器上进行,通过调整输入图像补丁大小、学习率、批大小以及网络层参数等,确定了最佳实验参数124。
- 对比实验结果:将 CMTNet 与多种先进方法对比,如随机森林(RF)、支持向量机(SVM)、2D-CNN、3D-CNN、Resnet、ViT、SSFTT 和 CTMixer 等。在三个数据集上,CMTNet 的总体准确率(OA)分别达到 99.58%、97.29% 和 98.31%,超越了当前最先进的方法 CTMixer,OA 值分别提高了 0.19%、1.75% 和 2.52%。在分类复杂场景下,CMTNet 能更好地整合高维信息,减少误分类,尤其在识别相似光谱特征的作物时表现出色356。
- 消融实验结果:通过消融实验验证了 CMTNet 各模块的有效性。结果表明,光谱 - 空间特征提取模块和多输出约束模块(MOCM)的加入显著提升了分类精度,MOCM 能有效增强模型的鲁棒性和稳定性7。
- 模型效率分析:对模型计算效率测试发现,传统机器学习模型运行速度快,但深度学习模型中,基于 Transformer 的方法比基于 CNN 的方法效率更高。CMTNet 虽然分类精度达到了最先进水平,但其计算成本高于传统机器学习方法8。
研究结论与讨论部分指出,CMTNet 在多种数据集上实现了最先进的分类性能,为精准农业中的作物分类提供了有力的技术支持,有效提升了高光谱作物分类的精度和可靠性。然而,该模型也存在一些局限性,如在阴影影响区域的分类准确性有待提高,小样本类别的过拟合风险仍需关注,计算成本较高限制了在资源受限设备上的部署。针对这些问题,研究人员提出了未来的研究方向,包括集成多模态数据(如 LiDAR 高程信息)增强模型在复杂环境下的鲁棒性,优化实时性能和探索模型压缩技术(如剪枝和量化)降低计算成本,以及结合边缘计算框架实现无人机平台的高效部署,推动精准农业的实时监测应用发展。这一系列研究成果和未来展望,为精准农业领域的发展开辟了新的道路,有望在实际农业生产中发挥重要作用,推动农业向着更加智能化、精准化的方向迈进。**