DLV3-CRSNet:助力大白菜与杂草语义分割性能飞跃,推动智慧农业新发展

时间:2025年5月7日
来源:Crop Protection

编辑推荐:

在复杂农业环境中,准确识别作物和杂草对智能除草管理至关重要。研究人员基于 DeepLabv3 + 模型构建 DLV3-CRSNet 模型。实验表明,该模型多项指标优于 DeepLabv3 + 等模型,能有效区分大白菜和杂草,助力农业智能化发展。

广告
   X   

在农业生产的大舞台上,精准区分作物和杂草一直是个棘手的难题。想象一下,农田里的大白菜和杂草相互交织,它们在大小、形状和生长密度上各不相同,土壤、灌溉线等还会带来视觉干扰,多变的光照条件更是让图像处理雪上加霜。传统的除草方式依赖大量人力,不仅效率低下,而且使用农药还会污染环境。随着科技的发展,基于深度学习的图像识别技术进入农业领域,其中语义分割技术凭借像素级的精细识别能力,成为识别幼苗和杂草的主流方法。然而,像 Pyramid Scene Parsing Network(PSPNet)、Expectation-Maximization Attention Networks(EMANet)等语义分割模型,在农业应用时却问题频出,计算复杂度高、实时性能差、模型体积大,严重阻碍了它们在大规模农业生产中的推广应用。即便大名鼎鼎的 DeepLabv3+,有着强大的语义分割能力,却也存在计算复杂、识别小目标能力欠佳等问题,在农业场景中难以施展拳脚。在这样的背景下,为了推动智能除草管理和可持续农业发展,国内研究人员开展了一项极具意义的研究。他们提出了 DLV3-CRSNet 模型,相关研究成果发表在《Crop Protection》上,为农业领域带来了新的曙光。

研究人员为开展此项研究,主要运用了以下关键技术方法:首先是数据收集与标注,他们于 2023 年 9 月 5 日 - 9 月 10 日,在吉林省长春市的湛林绿色农业采摘园收集数据集,选取处于 4 - 6 叶生长期且移植 7 - 10 天的大白菜幼苗进行图像采集;其次是构建 DLV3-CRSNet 模型,基于 DeepLabv3 + 模型,用 ConvNeXt 替换其 Xception 结构,融入 RepVgg 结构,并应用 Sigmoid Linear Unit(SiLU)激活函数;最后通过消融实验,定量评估网络结构替换和激活函数变化对模型的影响。

数据收集和标注


研究人员选择在吉林省长春市湛林绿色农业采摘园(125°12′9.587″E,43°59′3.602″N)收集数据。在 2023 年 9 月 5 - 10 日期间,采集处于幼苗期(移植后 7 - 10 天)、4 - 6 叶生长期的大白菜图像。种植间距保持在 40 - 45cm,行距为 55 - 60cm。这些数据为后续模型训练提供了基础。

消融实验


为验证 DLV3-CRSNet 模型的有效性,研究人员开展了消融实验。实验设置如下:用 ConvNeXt 替换网络结构得到 DeepLabv3+C;添加 RepVgg 模块得到 DeepLabv3+R;将激活函数替换为 SiLU 得到 DeepLabv3+S;最终构建完整的 DLV3-CRSNet 模型。通过对比分析,明确各部分结构和函数对模型性能的贡献。

研究结果


实验结果令人惊喜,DLV3-CRSNet 模型在多个关键指标上表现优异。与 DeepLabv3 + 相比,平均交并比(Mean Intersection over Union,MIoU)提高了 23%,平均像素准确率(Mean Pixel Accuracy,MPA)提高了 21%,平均精度(Average Precision,AP)提高了 23%,每秒帧数(Frames per Second,FPS)提高了 15%。同时,每秒浮点运算次数(Floating Point Operations per Second,FLOPS)和推理时间(Inference Time,IT)分别降低了 13% 和 12%。与 Pyramid Scene Parsing Network(PSPNet)、Expectation-Maximization Attention Networks(EMANet)、Fully Convolutional Networks(FCN)、UNet、Efficient Neural Network(ENet)和 Segmentation Network(SegNet)等模型相比,DLV3-CRSNet 模型的 MIoU、MPA、AP 和准确率平均分别提升了 27%、18%、18% 和 3%,并且参数数量减少了 2684 万。田间实验进一步证实,DLV3-CRSNet 模型能够有效区分大白菜(Brassica pekinensis Rupr.)和杂草,识别率分别达到 95.31% 和 93.6%。

研究结论和讨论


DLV3-CRSNet 模型成功解决了传统语义分割模型在农业应用中的诸多难题。通过用 ConvNeXt 替换 DeepLabv3 + 的骨干网络,降低了计算负担,提升了训练效率;融入 RepVgg 结构,简化了模型架构,改善了部署性能;应用 SiLU 激活函数,增强了小目标识别能力。该模型在复杂农业环境下对大白菜和杂草的语义分割性能显著提升,为智能除草管理提供了有力支持,有助于减少农药使用,推动可持续农业发展。这一研究成果为农业领域的智能化升级提供了新的技术方案,在未来农业生产中具有广阔的应用前景,有望成为农业现代化进程中的关键助力。

生物通微信公众号
微信
新浪微博


生物通 版权所有