在中国的水果供应链中,荔枝产业在果园面积、生产份额和出口量方面占据主导地位。位于广东省的茂名已成为核心的荔枝生产区:近年来,其荔枝种植面积达到了140万亩(约93,300公顷),整个荔枝产业链的产值超过了120亿元人民币(Xiong等人,2018年)。然而,这一蓬勃发展的产业面临着荔枝炭疽病的严重威胁,这是一种由多种真菌病原体引起的疾病,是荔枝(Litchi chinensis Sonn.)最常见的病害。
该疾病的流行病学特征非常明显:虽然在果实早期发育阶段感染就较为普遍,但损害通常不明显,直到环境条件变得有利时才会加剧——温度和湿度的升高会显著增加病情的严重程度,症状从淡黄色至棕色的果皮斑点发展为深棕色、水浸状的病斑,最终在果实成熟时形成橙红色的黏液状分生孢子簇。如果不加以控制,真菌菌株会导致严重的果实脱落、逐渐腐烂和脱落,从而导致产量大幅下降;在严重的疫情中,甚至可能造成作物完全损失(Zhao等人,2021年)。这一威胁凸显了进行有效、及时疾病监测的紧迫性,以保护荔枝生产。然而,大多数关于荔枝炭疽病的研究主要集中在叶片症状的检测上,因为叶片图像更容易获取,且叶片症状更为明显(Padol和Yadav,2016年;Ray等人,2025年)。相比之下,果实阶段的炭疽病检测面临更大的挑战,包括叶片的遮挡、早期病斑的微妙特征以及与自然果实表面纹理的高度相似性。因此,开发一个针对果实的强大检测系统对于及时管理和保护产量至关重要。
传统的监测方法依赖于人工巡查,这种方法存在固有的局限性:它具有主观性,依赖于巡查人员的经验和视觉敏锐度,导致准确性不稳定、假阳性结果以及遗漏的感染。此外,这种劳动密集型的方法无法满足现代商业果园快速、大面积监测的需求,缺乏实时警报能力和及时决策所需的处理能力。
最近,无人机(UAV)遥感技术的进步通过配备高分辨率RGB和多光谱相机的轻量级平台实现了果园规模的图像采集。结合计算机视觉算法,UAV图像可以自动检测和绘制疾病焦点,提供广泛的空间覆盖范围、高时间处理能力和低单位面积成本——这些特性对于大型商业果园尤为重要。然而,在复杂的果园环境中,利用UAV检测荔枝炭疽病仍面临诸多未解决的挑战:(1)叶片和树枝的遮挡会掩盖病斑;(2)小而早期的病斑视觉特征不明显,难以区分;(3)背景杂乱(如叶脉、果实上的镜面反射)导致高假阳性率;(4)UAV平台的资源限制(计算能力有限、电池寿命短)阻碍了实时推理。
现有的对象检测框架进一步加剧了这些挑战。传统的基于卷积神经网络(CNN)的模型(如R-CNN、YOLO、SSD)依赖于手工设计的组件(滑动窗口、区域提案网络),这些组件在处理病斑的极端规模变化和复杂的果园背景时表现不佳。尽管YOLO系列模型由于其端到端的效率而成为农业应用的主流,但在小目标召回率和抗遮挡能力方面仍存在局限。基于Transformer的检测器(如DETR(Carion等人,2020年)通过消除手动锚点和非最大值抑制(NMS)实现了端到端训练和全局上下文建模的优势。然而,后续的变体(如RT-DETR(Zhao等人,2024年)是为具有统一目标规模和充足计算资源的通用基准测试设计的,因此不适合果园场景——它们计算复杂度高、在边缘设备上的推理速度慢,并且在遮挡和语义背景稀疏的情况下无法有效检测小病斑。
这些行业需求、技术差距和环境限制共同构成了本研究的必要性:迫切需要一个轻量级、实时的端到端检测模型,适用于UAV部署,能够应对遮挡、小目标检测、类别不平衡和计算效率问题。为了解决这一关键需求,我们提出了ACF-DETR,这是一个专门用于荔枝炭疽病监测的框架。本研究的主要目标包括:
1. 数据集:我们收集并手动标注了510张实地图像和100张网络图像,涵盖了三种主要商业品种“费子笑”、“桂味”和“糯米糍”。这些图像是在不同的天气、光照和疾病进展条件下获取的,通过严格的增强处理后,数据集扩展到了3322张。
2. 轻量级主干网络:提出了一种新的架构,结合了双交叉中心差分卷积(DCConv)和逐元素乘法。该设计在保持低计算开销的同时编码了多方向对比度,非常适合边缘设备部署。
3. 高效的混合编码器和损失函数:引入了基于内容的块(CGB)和CARAFE的上采样器,将高级语义与低级细节融合在一起,显著提高了小病斑的召回率。重新参数化的跨阶段部分连接模块(RepC3)进一步加强了跨尺度交互。此外,Focal-enhanced MPDIoU损失函数动态地重新分配了难样本和易样本的权重,减轻了遮挡、叶片杂乱和类别不平衡问题,从而提高了边界框回归的准确性和训练稳定性。
4. 适用于UAV的部署:围绕NVIDIA Jetson Orin Nano构建了一个完整的无人机系统。ACF-DETR算法已完全适配到边缘设备,并进行了定制的电源管理,实现了满足自主果园巡查需求的实时推理。