针对花生叶 disease 实时检测中轻量级模型存在的效率与准确率平衡问题,本文提出YOLO-PLNet模型,通过引入LAE模块、CBAM模块和AFPN模块优化特征提取与融合,在保持高检测准确率(mAP@0.5达98.1%)的同时显著降低参数数量(2.13M)和计算复杂度(5.4G),并验证其在Jetson Orin NX边缘设备上的实时性能(INT8精度下41.3 FPS)。
广告
X
花生作为一种重要的经济作物,其生长过程中经常受到叶部病害的威胁,这不仅影响产量,还严重降低品质。因此,实现早期和准确的病害检测成为农业智能化发展的关键环节。然而,现有的轻量化深度学习方法在模型体积、实时检测精度以及边缘设备部署之间往往难以取得良好的平衡,这在大规模农业应用场景中限制了其广泛应用。本文提出了一种名为YOLO-PLNet的轻量化实时检测模型,专门设计用于边缘设备的部署。该模型基于YOLO11n,并对主干网络和颈部结构进行了轻量化改进。引入了轻量级注意力增强(LAE)卷积模块,以减少计算负担,同时结合通道-空间注意力机制(CBAM)来增强对小病斑和边缘模糊目标的特征表示能力。此外,检测头采用了渐进式特征金字塔网络(AFPN),利用跨层融合策略,提高多尺度检测性能。这些改进显著提升了花生叶部病害在复杂背景下的检测精度,并增强了模型在边缘设备部署中的适应性。实验结果表明,YOLO-PLNet的参数数量、计算复杂度和模型大小分别为2.13M、5.4G和4.51MB,分别比基线YOLO11n减少了18.07%、16.92%和15.70%。在mAP@0.5和mAP@0.5:0.95指标上,YOLO-PLNet分别达到98.1%和94.7%,比YOLO11n提升了1.4%和1.7%。当在Jetson Orin NX平台部署,并使用CSI摄像头进行实时视频输入时,模型在FP16精度下实现了19.1毫秒的延迟和28.2帧每秒(FPS)的检测速度。在INT8精度下,延迟进一步降低至11.8毫秒,检测速度提升至41.3 FPS,同时显著降低了GPU使用和能耗,仅轻微影响检测精度。综上所述,YOLO-PLNet在高检测精度和强大的边缘部署性能方面表现出色,为花生叶部病害的智能监测提供了一种高效且可行的解决方案。
在现代农业的发展背景下,基于计算机视觉的植物病害检测技术已成为主流解决方案,因其具备非接触、自动化和高效率等优势。研究人员广泛探索了深度学习模型在作物病害识别中的应用。例如,Miao等人提出了SerpensGate-YOLOv8模型,该模型结合了DySnakeConv、SPPELAN和STA注意力机制,在公开的PlantDoc数据集上达到了71.9%的精度。类似地,Ayon等人对四种深度学习模型(VGG16、ViT、EfficientNetB3和Xception)在茶树图像数据集上进行了系统比较,验证了Transformer架构和传统卷积神经网络(CNN)在茶树病害识别中的有效性。然而,这些模型通常依赖于高性能服务器或桌面级GPU平台,这使得它们在资源受限的嵌入式边缘设备上难以稳定运行。在花生种植场景中,病害分布广泛且密集,单帧图像检测无法全面覆盖连续区域。因此,使用低功耗、紧凑型边缘AI设备进行实时视频检测成为一种有前景的发展方向。通过在边缘平台(如Jetson Orin NX和Jetson Orin Nano)上进行推理,可以在田间实现实时检测,从而显著降低上行带宽和传输延迟,确保在弱网络条件下也能实现连续监测。此外,这些设备可以与无人机和自主农业机械协同工作,降低人工成本并提高农药施用或灌溉的效率。
为解决上述挑战,研究人员越来越多地关注设计轻量级网络架构,如YOLO、MobileNet、ShuffleNet和EfficientNet,以实现深度学习病害检测模型在边缘AI设备上的高效部署。Zhang等人提出了GVC-YOLO模型,专门用于在边缘设备上进行棉花蚜虫叶部病害的实时检测。该模型基于YOLOv8n,集成了GSConv、VoVGSCSP、SimSPPF和坐标注意力机制,实现了48 FPS的实时推理速度,同时保持了97.9%的检测精度,模型大小仅为5.4 MB。同样,Xie等人引入了YOLOv5s-BiPCNeXt模型,该模型结合了MobileNeXt主干网络、C3-BiPC结构、EMA注意力机制和CARAFE上采样操作,实现了在Jetson Orin Nano上的26 FPS的高效检测,有效平衡了部署效率和识别性能。此外,一篇综述系统地总结了边缘AI和物联网在实时作物病害检测中的关键技术,将其分为四类:边缘感知和处理框架、轻量级模型、数据驱动方法以及针对农业场景的通信协议。该综述强调了基于MobileNet/EfficientNet的CNN,结合剪枝和量化等技术,已经在Raspberry Pi和Jetson Nano等硬件上实现了有效的病害检测。
在这些研究的基础上,我们开发了一种高效的花生叶部病害检测模型YOLO-PLNet,并将其部署在Jetson Orin NX边缘设备上。基于YOLO11n,我们集成了轻量级注意力增强卷积模块,以提升模型对边缘细节和目标区域的感知能力。此外,我们利用渐进式跨层融合的Asymptotic Feature Pyramid Network(AFPN)来改善检测性能。在部署阶段,我们采用TensorRT进行精度优化和推理加速,将模型部署在配备工业级CSI摄像头的Jetson Orin NX边缘平台上。通过使用田间捕捉的视频流进行实时检测,并在FP16、INT8和多分辨率设置下对模型的延迟、帧率、内存使用和功耗进行了系统评估。总体而言,本研究为花生叶部病害的精确识别和智能管理提供了一个可行的技术方案。
为了满足田间花生叶部病害实时检测的需求,以及低延迟和低功耗的要求,本研究选择了NVIDIA Jetson Orin NX作为边缘部署平台。该设备集成了1,024个CUDA核心和32个Tensor Core,以INT8精度实现了高达100 TOPS的AI推理性能。它能够高效地在本地运行深度神经网络,避免网络传输带来的延迟和不稳定。此外,Jetson Orin NX支持通过JetPack SDK开发端到端加速的AI应用,便于模型优化、部署和现场集成。如图7所示,该平台具备小型化、高性能和低功耗等优势,适用于农业机器人和植物保护无人机等边缘设备。这有助于实现现场定位和快速响应花生病斑。Jetson Orin NX的详细硬件参数详见表4。
为了验证YOLO-PLNet在边缘设备上的部署适应性和实时推理能力,我们构建了一个完整的推理流程,涵盖真实的花生田场景,如图12所示。该流程基于Jetson Orin NX开发套件(图7),该套件作为硬件基础。在平台上,训练好的YOLO-PLNet模型首先从.pt格式转换为ONNX中间表示,然后通过TensorRT工具链优化为.engine推理引擎文件。为了模拟田间动态监测需求,引入了工业级CSI(Camera Serial Interface)摄像头,该摄像头能够捕捉包含自然光照变化和叶片运动干扰的真实视频流。通过TensorRT运行时加载.engine文件,并结合摄像头输入的实时视频流,进行逐帧推理和可视化,验证了模型在动态和复杂边缘场景下的部署性能。
为了验证模型在边缘设备上的推理效率,本研究基于图12所示的边缘部署推理流程,使用主流推理框架TensorRT进行实验。TensorRT提供了多种精度优化方法,包括FP16半精度和INT8整数量化部署模式。FP16精度使用半精度浮点表示,具有计算速度快和内存使用低的优势,广泛应用于边缘设备上的高效推理场景。相比之下,INT8精度将权重和激活值量化为8位整数,使模型大小和设备功耗进一步降低,同时保持一定的精度,这与资源受限的边缘设备需求高度契合。在完成模型训练后,我们使用TensorRT提供的后训练量化(PTQ)工具链,将原始ONNX模型(FP32精度)直接转换为FP16和INT8精度版本,避免了重新训练的高昂成本。随后,将这些版本部署在Jetson Orin NX平台上,以验证不同量化策略对部署性能的影响,详细结果见表9。
实验结果表明,在不同的量化精度下,模型的检测精度差异较小,而推理效率和资源利用率的提升显著。INT8量化模型相比FP16精度,在推理延迟上减少了38.21%,帧率提高了46.45%,同时显著降低了内存使用和功耗,虽然检测精度略有下降至97.5%。这使得模型能够在低功耗的嵌入式平台上实现高效的实时病害检测。尽管INT8量化导致了轻微的精度下降,但其在功耗和速度上的显著提升对于电池供电的移动平台(如农业无人机和巡检机器人)至关重要。这种效率得到了Jetson Orin NX在INT8精度下约100 TOPS性能的支持,使其能够在田间连续运行,满足农业中对可持续边缘AI的日益增长的需求。