摘要
目的
真菌病害仍然是全球农作物损失的主要原因之一,其管理仍然严重依赖杀菌剂的应用。尽管传统的决策支持系统和机器学习模型提供了有价值的预测洞察,但它们往往忽略了病原体传播背后的空间和关系动态。本研究评估了图神经网络(GNNs)在预测三种关键作物(洋葱(Botrytis squamosa)、生菜(Botrytis lactucae)和胡萝卜(Cercospora carotae)中真菌病害发生方面的可行性和优势,以增强精准农业的决策制定。
方法
使用魁北克南部农场的实地观察数据构建了植物级别的图谱,节点代表富含生物和天气特征的植物,边由空间邻近性定义。训练了图卷积网络进行二元真菌病害发生分类,并将其与机器学习和深度学习基线进行了对比。应用了图增强技术和在缺失和噪声特征下的鲁棒性测试来评估GNN的稳定性。
结果
在三种病原体系统中,GNNs取得了最强的整体预测性能。对于洋葱(B. squamosa),随机森林在完整特征集上的表现略优于GNN(准确率=76.4%,F1分数=0.77);在这种情况下,GNN提供了较低但可比较的指标分数(准确率=74.8%,F1分数=0.73)。对于生菜(B. lactucae),GNN取得了最高的指标分数,准确率为90.4%,F1分数为0.90,超过了所有其他基线。对于胡萝卜(C. carotae),GNN的准确率为75.8%,F1分数为0.77,明显优于决策树、随机森林、k-NN和前馈神经网络(FFNs)。图增强进一步改善了GNN的结果:随机游走采样将洋葱数据的模型准确率提高到79.3%,F1分数提高到0.79;对于生菜数据,分别提高到93.9%和0.94;而节点/边扰动将胡萝卜数据的模型准确率提高到78.6%,F1分数提高到0.80。此外,鲁棒性实验的结果表明,即使最多75%的特征被屏蔽或50%被噪声替换,GNN仍能跟踪整体田间的感染趋势。
结论
GNNs通过结合空间和关系的植物模式,在真菌病害预测方面具有明显优势,从而提高了预测结果的准确性和鲁棒性。
引言
精准农业已成为现代农业的一种变革性方法,旨在通过整合数字技术来提高生产者的效率、盈利能力和可持续性(Weiss等人,2020年;Boursianis等人,2022年)。与传统农业实践不同,精准农业鼓励在空间和时间上局部化的田间干预(Gebbers & Adamchuk,2010年)。这一转变得益于地理空间信息的增加、高分辨率天气数据、传感器网络的普及以及收集植物级别数据的便利性(Mekala & Viswanathan,2017年;Ramin Shamshiri等人,2018年)。通过收集和分析这些异构数据流,可以识别田间的变化并应用有针对性的干预措施,优化肥料、农药和水的使用。在过去十年中,这种方法已成功应用于产量预测、土壤养分管理、灌溉优化、杂草检测和疾病监测,展示了其在推进农业实践方面的潜力(Kamilaris & Prenafeta-Boldú,2018年;Baburao等人,2023年)。尽管农业科学取得了显著进展,真菌病害仍然是对全球农作物生产最具持续性和破坏性的威胁之一。据估计,它们导致全球主要作物的年产量损失达10-20%——在有利的环境条件下,某些病原体甚至能够摧毁整个收成(Savary等人,2019年)。关键真菌病原体(如Botrytis spp.和Cercospora spp.)的生物学特性与气候因素(包括温度、湿度和叶片湿度)密切相关,这些因素直接影响孢子的萌发、传播和感染成功率(Agrios,2004年;Fall等人,2016年)。当前的管理策略严重依赖预防性或治疗性杀菌剂的应用。然而,这些化学物质的滥用和过度使用带来了严重风险:它们可能危害当地生态系统,加速抗性病原体的出现,并引发对人类健康和食品安全的担忧(Hahn,2014年)。例如洋葱中的Botrytis squamosa、生菜中的Botrytis lactucae和胡萝卜中的Cercospora carotae的反复爆发就体现了这些挑战,造成了巨大的经济损失(Carisse & Philion,2002年;Fall等人,2015年)。这些现实突显了迫切需要能够预测疾病爆发并优化干预时机的工具。
疾病预测系统传统上基于天气决策支持工具构建。这些系统使用气候数据和经验衍生的基于规则的算法来估计农田中的感染风险。其中一个最广泛采用的模型是BOTCAST,专门用于预测洋葱作物中的Botrytis squamosa爆发。BOTCAST整合了关键变量(温度、相对湿度和叶片湿度持续时间)来生成风险指数,以指导杀菌剂的应用时机(Sutton等人,1986年)。类似的框架也为其他病原体系统开发,通常针对特定作物和区域条件进行了定制(Magarey等人,2005年)。尽管这些基于天气的系统在减少不必要的杀菌剂使用方面显示出价值,但它们本质上受到专家定义的阈值的限制,这限制了它们在不同气候条件下的适应性。它们也可能忽略与作物生理、农艺实践和病原体种群动态的关键相互作用(Gent等人,2013年)。因此,它们在不同地区或种植系统之间的可转移性通常较差——这突显了需要更灵活、数据驱动的预测方法。
将传统的机器学习(ML)模型整合到农业预测中引入了一种新的植物疾病建模范式。与基于规则的系统不同,ML模型直接从数据中学习模式,能够捕捉变量之间的复杂非线性关系和相互作用。经典的ML算法(如决策树、随机森林、支持向量机和广义线性模型)已广泛应用于包括产量预测、土壤属性估计和疾病检测等任务(Chlingaryan等人,2018年;Liakos等人,2018年;Baburao等人,2023年)。这些模型具有实际优势:它们需要相对较小的数据集和计算资源,同时保持高度的可解释性(Kamilaris等人,2017年;Kamilaris & Prenafeta-Boldú,2018年)。最近,深度学习(DL)架构进一步提高了预测性能——尽管通常以牺牲模型透明度为代价(Fu等人,2018年;Milioto等人,2018年)。虽然深度学习模型的多样性使得在这里无法全面覆盖,但有两种DL架构与我们的研究特别相关:前馈神经网络(FNNs)和长短期记忆(LSTM)网络。这两种网络都用于处理大型多变量数据集。FNNs在模拟环境和生物变量之间的复杂非线性相互作用方面特别有效——使它们非常适合使用结合天气、作物物候和健康指标的集成数据集进行疾病风险预测(Kamilaris等人,2017年;Kamilaris & Prenafeta-Boldú,2018年)。相比之下,LSTMs旨在捕捉序列数据中的时间依赖性,使其非常适合模拟依赖于连续时间段的病原体动态。这两种架构在植物病理学应用中都取得了成功(Liakos等人,2018年)。然而,尽管FNNs和LSTMs具有预测能力,但它们通常将观测值视为空间独立的,忽略了农业系统的本质关系性和空间性。疾病传播很少孤立发生;它遵循由植物邻近性、田地地形和连通性塑造的空间模式。此外,DL模型通常需要涵盖各种环境条件的大型多样化训练数据集,这一要求可能阻碍它们在不同作物、地区或管理系统之间的泛化能力(Kamilaris & Prenafeta-Boldú,2018年)。这些限制突显了需要明确考虑农业生态系统中嵌入的空间、时间和关系结构的建模方法。
图神经网络(GNNs)是一个有前景的替代方案,它将深度学习扩展到关系型非欧几里得数据结构。与传统的机器学习或传统DL模型不同,GNNs使用图表示明确编码实体之间的关系。在农业背景下,单个植物可以被建模为节点,而它们的空间邻近性、生态相似性或共享的环境条件形成边(Gupta & Singh,2023年)。通过迭代消息传递(见图2中的消息传递总结),每个节点的表示不仅汇集了自身的特征,还汇集了其邻居的特征——从而产生更丰富、基于生物学的表示(Zhou等人,2020年)。这种架构特别适合真菌病害预测,因为病原体传播通常由田间易感宿主的空间聚集驱动。通过整合生物特征和环境协变量,GNNs不仅提高了预测准确性,还对噪声和缺失的田间数据具有固有的鲁棒性,这是现实农业监测中的一个持续挑战。
最近的研究强调了GNNs在农业应用中的多功能性。Vyas和Bandyopadhyay(2022年)引入了一个用于土壤湿度预测的动态GNN框架,结合了空间消息传递和时间序列建模。Gupta和Singh(2023年)开发了Agri-GNN,该系统将农业地块表示为通过空间和基因型相似性连接的节点,在产量预测方面显著优于传统ML模型。在经济领域,Min等人(2025年)证明,当纳入天气变量时,基于GNN的模型在预测商品价格方面优于循环神经网络。同时,Lu等人(2025年)设计了一个时空注意力引导的GNN,用于精确估计玉米中的氮含量。总体而言,这些研究将GNNs置于农业AI的前沿——弥合了传统建模方法与农业生态系统的复杂关系性质之间的差距。
该领域的最新工作还展示了基于GNN的架构在自动化检测多种作物中的植物疾病和害虫方面的强大潜力。Bera等人(2024年)开发了PND-Net分类框架,在CNN模型之上引入了图卷积网络层,提高了营养缺乏和疾病的分类准确性,达到了96.18%。Yadav和Bondre(2025年)评估了几种GNN混合架构用于从图像数据中检测小麦叶病,其中基于GNN + CNN的模型实现了93%的最高准确率,从而证明了基于图的学习可以增强卷积特征提取器的预测能力。Maruthai等人(2025年)也贡献了类似的混合GNN + CNN方法,他们的Hybrid Vision-GNN(HV-GNN)架构使用底层植物图像的不同片段作为图节点,以更好地表示它们之间的关系。GNNs还越来越多地整合到更广泛的农艺建模和决策支持框架中。在这方面,Yang等人(2023年)解决了由于数据源异质性导致的稀疏特征属性问题,以提高玉米品种的产量预测。这些作者利用生成对抗网络模型与GNN相结合,实现了改进的预测性能。吴等人(2025年)展示了基于图的学习方法与混合GNN-EnKF框架的进一步整合,用于棉花冠层氮含量的估算。在该框架中,GNN建立了多源遥感观测数据之间的空间邻域依赖关系。这种数据驱动的关系学习使得GNN-EnKF在实验研究中优于CNN和Transformer基线模型。从基于天气的决策支持系统(如BOTCAST),到灵活的机器学习和深度学习模型,再到现在的图神经网络(GNN),这一发展轨迹反映了预测系统在理解宿主、病原体和环境之间相互作用方面的逐步深化。BOTCAST类型的系统提供了可解释性,但缺乏适应性;传统的机器学习和深度学习模型虽然提高了灵活性,但常常忽略了空间依赖性;而GNN则通过将关系和空间结构直接编码到学习过程中,实现了更进一步的进步。基于这一基础,我们的工作研究了GNN在预测加拿大魁北克省洋葱、生菜和胡萝卜作物真菌爆发方面的能力。通过将植物建模为通过空间邻近性连接的节点,并用生物和天气衍生特征丰富图结构,我们评估了基于图的学习方法是否能够超越传统的机器学习和深度学习方法,并显著扩展当前决策支持工具的能力,以实现更可持续、精准化的作物保护。
**方法论**
**数据收集与预处理**
本研究使用的数据来自2021年生长季节期间加拿大魁北克南部蒙特雷吉地区的园艺农场。对种植四种蔬菜作物的商业田地进行了每周的实地考察:胡萝卜(Daucus carota L.;品种Volcano和SV2384)、洋葱(Allium cepa L.;品种Redwing、Traverse、Cartier、Highlander和Frontier),以及绿卷叶生菜(Lactuca sativa var. crispa cv. Bergam’s Green)或奶油头生菜(Lactuca sativa var. capitata cv. Estival)。实验试验共包括了五个洋葱田、四个生菜田和三个胡萝卜田(见图1)。在每个田地中,按照“W”形样带随机选择了25株植物,以确保样本的空间代表性。这些植物在整个生长季节内被监测其各自真菌病的症状。关于特定作物数据收集协议的更多细节见表1。
**图1**
(该图像的替代文本可能是使用AI生成的。)
**研究田地的地理位置**
A. 区域背景图,显示了研究区域在魁北克南部的位置。
B. 研究区域的详细地图,标出了分析中包含的洋葱(黄色)、生菜(蓝色)和胡萝卜(橙色)田地以及当地气象站(红色)的位置。
**生物测量**
生物测量在叶片层面进行,并根据作物类型有所不同。对于洋葱植物,评估内容包括存活和死亡叶片的数量、倒伏叶片的百分比以及Botrytis squamosa感染的严重程度,该感染程度根据观察到的病斑数量进行评分:0表示没有病斑,1表示1-5个病斑,2表示6-10个病斑,3表示11-20个病斑,4表示21个或更多病斑。对于生菜植物,评估仅关注Botrytis lactucae感染的严重程度,按受影响叶片面积的百分比评分:0表示没有症状,1表示1-10%,2表示11-35%,3表示36-50%,4表示超过50%的受影响面积。对于胡萝卜植物,测量内容包括绿色叶片的数量和生长阶段,以及Cercospora carotae感染的严重程度,根据估计的病斑覆盖面积评分:0表示没有病斑,1表示1-5%,2表示15%,3表示25%,4表示50%或更多。受感染的植物在整个生长季节内接受了根据标准商业实践进行的针对性杀菌剂处理,以控制病害进展。在每个监测田地中,相同的植物在整个生长季节内被持续监测,以确保对每个植物个体病害进展的一致跟踪。
**数据收集任务总结**
(见表1)
**气象数据**
气象数据使用四个Onset HOBO RX3000远程监测站收集,这些监测站配备了多种传感器,包括风速和风向传感器(S-WSET-B)、0.2毫米倾倒式雨量计(S-RGB-M002)、太阳辐射传感器(S-LIB-M003)以及温度和相对湿度传感器(S-THB-M002)。每个气象站距离调查田地2.5±1.4公里,数据通过蜂窝网络传输进行收集。
**图构建**
为了有效应用图神经网络(GNN)预测真菌病的发生,每个农场站点在每个观测日都构建了一个单独的图。这样每个目标病原体都有一个专用的图数据集,其中每个图将给定站点的25株监测植物编码为单独的节点。节点通过空间邻近性用边连接:任何相距25米以内的两株植物通过边相连,而距离较远的植物保持不连接状态。每个图节点代表一株植物,并关联一个特征向量,该向量结合了其生物测量数据(例如病害严重程度、叶片状态)和特定田地的天气衍生变量。这些节点特征和空间边共同构成了适合GNN建模的结构化图表示(见图2)。
**节点特征向量构建**
考虑了两种构建节点特征向量的不同方法,它们在依赖手动特征工程方面有所不同。第一种方法结合了一组最小的生物和气象相关特征,这些特征基于BOTCAST系统(Sutton等人,1986年)选择——该系统最初用于预测洋葱叶片上的Botrytis发展——以及可用的植物级健康指标。这导致了特征向量的紧凑性,维度范围从5到8,具体取决于作物和植物级生物测量的可用性。第二种方法旨在评估GNN自主识别哪些特征对其任务最具预测性的能力。在这里,所有原始气象变量和衍生的工程特征都被包含在每个节点的特征向量中,每个节点大约有130个特征(洋葱:132个特征,胡萝卜:131个特征,生菜:129个特征——没有植物特征可用)。这种数据丰富的表示方法允许模型直接从数据中学习特征相关性,而无需事先的人工选择或数据集缩减。
**图神经网络中的消息传递框架**
图3展示了GNN中典型的消息传递框架。来自连接节点的特征向量被聚合为完整数据(图3A)或不完整数据(图3B)。完整的更新操作(图3C)可以描述为来自局部节点邻域的信息的加权求和(Hamilton,2020年),这增强了GNN学习空间信息的能力,因为边可以携带代表节点间空间距离的不同权重(在我们的案例中是植物)。
**模型架构与训练参数**
图神经网络使用PyTorch Geometric库(v2.4.0)进行训练,实现了基于Kipf和Welling关于半监督分类的图卷积网络工作的标准GCNConv架构(Kipf和Welling,2017年)。模型架构包括输入层、多个隐藏层和最终输出层。输入层执行初始图卷积,将原始节点特征映射到第一个隐藏表示。每个后续隐藏层应用图卷积,随后是ReLU激活函数和dropout用于正则化。根据数据集和图增强技术的不同,使用了3、4或5个隐藏层,每个隐藏层包含16、32、64或128个神经元。最终层执行图卷积并通过log-softmax函数输出类别概率。
**模型性能评估**
模型性能在保留的测试集上使用三个关键指标进行评估:准确率、F1分数和ROC-AUC。使用k折交叉验证框架和Adam优化器在验证集上进行优化,同时通过网格搜索系统地调整了学习率、层数和隐藏通道数等关键超参数,以最大化预测性能。我们计算并报告了20个独立训练模型的上述指标的平均值±标准差(见表2、3和4)。
**图增强技术**
图增强技术的目标是修改原始图的结构和/或特征,以提高GNN在下游任务中的表现。尽管Ding等人(2022年)提出了许多类型的图数据增强方法,但我们选择了以下以结构为导向的增强技术:
- **节点和边扰动**:从图中随机移除一部分节点及其连接的边,模拟缺失的植物和不完整的观测数据。此外,随机删除或插入剩余节点之间的边,引入随机噪声到连接结构中。这种双重扰动减少了了对特定配置的依赖性,帮助模型容忍缺失数据,并减轻了对原始图拓扑的过拟合。
- **随机游走采样**:从选定的节点开始随机游走,并遍历相邻节点直到固定的游走长度。每次游走产生一个不同的子图,重复采样创建了多样化的重叠局部邻域集合。这迫使模型关注局部依赖性,并学习疾病相关信号如何在植物间传播。
- **Louvain采样**:应用Louvain社区检测算法将图划分为内部连接密集、外部链接稀疏的节点簇。每个簇都会诱导出一个子图,代表一个连贯的社区。与随机游走相比,Louvain的采样方法产生的子图是不重叠的,并且具有语义意义,强调了社区层面的结构。距离阈值:通过改变节点间边的最大允许距离来重新生成图。从一个严格的阈值开始,该阈值会产生稀疏的连接性,然后逐渐放宽阈值以生成越来越密集的图。只保留唯一的拓扑结构。这使模型能够接触到从碎片化到几乎完整的各种连接结构,并允许它学习空间邻近性在疾病传播中的作用。为了评估所提出的图神经网络模型的性能,使用了一组成熟的机器学习和深度学习分类器。这些模型涵盖了可解释的、集成的、基于距离的和神经网络的方法,代表了农业预测任务的标准工具包(见图4总结)。决策树:一种非参数分类器,通过递归二分法划分特征空间。虽然决策树具有可解释性和计算效率,但在应用于高维或噪声数据集时容易过拟合。随机森林:基于自助样本构建的决策树集合,在每次分割时进行随机特征选择。随机森林通过减少方差来提高泛化能力。它们被广泛认为是农业数据集中分类任务的稳健基线。k最近邻(k-NN):一种非参数方法,根据特征空间中k个最近训练样本的多数标签对节点进行分类。尽管k-NN是一种简单的分类器,需要最少的训练,但其性能对距离度量的选择以及无关或噪声特征的存在非常敏感。前馈神经网络(FFN):一种多层感知器,通过连续的非线性变换映射输入特征。FFN能够建模特征之间的复杂非线性关系,但通常需要更大的数据集和仔细的超参数调整以避免过拟合。所有基准机器学习分类器(决策树、随机森林、k-NN和FFN)都是使用scikit-learn库实现的(Pedregosa等人,2011年)。对于每个模型,根据它们在验证集上的表现通过网格搜索调整超参数。为了确保与GNN模型进行公平和无偏的比较,所有分类器都使用相同的测试集进行训练和评估(即每种作物一个固定的测试集),这些测试集在整个模型优化过程中完全保留下来,仅用于最终的性能评估。对于每种分类器和特征集组合,独立训练了20个模型。相应的准确率、F1分数和ROC-AUC分数结果在表2中报告为这些运行的平均值±标准差。图4 这张图像的替代文本可能是使用AI生成的。全尺寸图像 我们研究中使用的传统和深度学习模型 这些分类器共同提供了一个全面的基准,包括可解释的基于规则的模型、集成方法、基于距离的学习和深度神经网络。它们的包含允许严格评估基于图的方法是否在农业预测方面比现有技术具有可测量的优势。为了评估所提出模型在现实田间条件下的稳定性,我们进行了两项稳健性实验:(1)预测整个生长季节中的植物/田间疾病发生情况。(2)通过掩码和噪声注入技术在推理时降低图节点特征的质量。所有稳健性分析都是在模型训练之后进行的。在每种情况下都使用了在完整(未受干扰)训练数据上训练的最佳模型。以下是我们研究中进行的稳健性实验的简要描述:预测整个生长季节中的植物疾病发生情况 对于每种作物和特征集,我们按时间顺序(即一年中的天数,即DOY)应用每个图(农场日)表现最佳的训练模型。在每个DOY,模型输出测试节点上真菌疾病存在与否的节点级概率;通过平均节点间的预测概率将这些概率汇总为田间感染比例。为了减少对单次训练运行的依赖,我们报告了5个独立训练模型的平均值±标准差(SD)结果。曲线是根据同一DOY从真实标签计算出的观察感染比例绘制的。推理时特征掩码 为了量化训练模型对缺失特征的容忍度,我们通过在推理步骤中随机掩码p ∈ {0%,25%,50%,75%,90%}的节点特征条目来模拟不完整的感知。掩码在每个测试图的节点和特征通道上均匀随机应用,使用固定的种子以确保跨DOY的可重复性。使用训练统计数据进行归一化后,掩码条目被设置为零,这相当于在保持比例的同时移除了相应的信息。然后像在未受干扰的设置中一样生成预测,并汇总为田间比例;报告了5个模型的平均值±SD结果。推理时特征噪声 为了评估对损坏信号的恢复能力,我们仅在推理时用从0到1的均匀分布中独立采样的合成噪声替换了p ∈ {0%,25%,50%,75%,90%}的节点特征条目。这种类型的噪声在保持全局比例的同时破坏了特征和标签之间的信息耦合。噪声位置在节点和特征通道上均匀随机抽取,模型输出如上所述汇总,并总结为5个模型的平均值±SD结果。我们研究中使用的匿名数据和方法的源代码可以在我们的GitHub仓库中免费获取:https://github.com/Stephane-S/GNN_Fungal_Disease_Occcurence_Paper。结果 在本节中,我们展示了五种竞争模型(即决策树、随机森林、k-NN、FNN和GNN)预测洋葱、生菜和胡萝卜作物中真菌疾病爆发的主要结果。对于每种作物,构建了两个不同的数据集:完整集,其中植物/节点特征向量包含了所有可用的生物和气象属性(每个节点约130个特征);以及BOTCAST集,其中包含了最多八个变量的简化特征子集,以反映BOTCAST预测系统的逻辑(Sutton等人,1986年)。GNN的训练动态在图5中展示,该图显示了表现最佳模型的代表性训练和验证损失曲线。这些曲线展示了稳定的收敛性和没有过拟合,加强了下面报告的性能比较的有效性和可靠性。图5 这张图像的替代文本可能是使用AI生成的。全尺寸图像 根据完整(标记为base)和BOTCAST洋葱数据集的准确率得分,表现最佳的GNN模型的训练和验证损失曲线。与传统的机器学习和深度学习模型相比,GNN在所有三种作物上都表现出强大且一致的性能(见表2)。然而,对于洋葱数据,使用完整特征集的随机森林模型取得了最高的准确率(76.39%±4.58),相应的ROC-AUC和F1分数分别为0.77(±0.05和±0.04)。在相同的特征集下,GNN的表现与k-NN和决策树模型相当,达到了74.76%(±1.06)的准确率。当模型在简化的BOTCAST特征集上训练时,大多数传统分类器的性能下降了2%到5%——除了k-NN,其准确率略微提高到75.15%(±1.97),成为这种配置下的最佳表现者。对于生菜数据,GNN明显优于所有其他竞争模型,无论特征集如何。使用完整特征集时,它达到了90.44%(±0.25)的准确率,以及ROC-AUC和F1分数分别为0.90(±0.02)和0.90(±0.01)。值得注意的是,即使使用有限的BOTCAST特征,其准确率和F1分数也保持稳定,这突显了其对特征减少的鲁棒性。包括随机森林和k-NN在内的传统分类器在完整集上的准确率在85.68%到87.98%之间。标准的FNN在使用BOTCAST数据时显示出更高的准确率(89.51%±3.66),并且其ROC-AUC结果与GNN相当,尽管其F1分数从0.89下降到0.87,表明在类别平衡方面存在权衡。对于胡萝卜数据,GNN和标准FNN在两种特征配置下都超过了所有其他模型。GNN在使用完整数据集时达到了75.75%(±1.57)的准确率和F1分数——关键的是,即使在简化的BOTCAST数据集下也保持了这一性能水平。相比之下,传统机器学习模型的表现更加不稳定:例如,FNN的准确率不确定性在完整数据集上达到了±6.96%,突显了这种方法对特征变化和数据结构的敏感性。表2 机器学习和深度学习模型在疾病发生预测方面的结果,包括准确率、ROC-AUC和F1分数。全尺寸表格 在GNN训练期间,训练损失始终低于验证损失。如表3所示,最后5个时期的损失斜率在所有模型中都可以忽略不计(范围:约±0.001),确认了稳定收敛到平台期。训练和验证准确率之间的泛化差距也很小,从0.84%(洋葱 - 完整)到2.68%(胡萝卜 - 完整),F1分数差距从未超过0.04。验证和测试性能也非常接近,表明基于验证准确率的最佳时期选择策略没有引入训练过程中的偏差。这些结果共同证实了我们的GNN模型能够可靠地泛化到未见数据,并且表2中报告的性能不是过拟合的产物。表3 考虑的六个GNN模型的训练、验证和测试性能统计。全尺寸表格 使用图增强技术的GNN实验 使用图增强技术对GNN在洋葱、生菜和胡萝卜数据集上的性能进行了评估,使用了完整和BOTCAST特征集。获得的结果总结在表4中。此外,图6显示了没有图增强的GNN以及所有增强模型的接收者操作特征(ROC)曲线。对于洋葱数据,所有四种增强策略都优于没有图增强的基本GNN,无论特征集如何。当应用于完整特征集时,随机游走采样取得了最大的收益,准确率提高到了79.27%(±1.83),ROC-AUC和F1分数分别为0.79(±0.02)。使用BOTCAST特征集时,距离阈值采样取得了最强的结果,准确率为74.98%(±1.49),ROC-AUC为0.75(±0.01),紧随其后的是Louvain采样,准确率为74.05%(±1.61),ROC-AUC为0.74(±0.02),F1分数为0.75(±0.01)。对于生菜数据,增强效果更具选择性:只有随机游走采样一致地提高了基本GNN的性能,准确率达到93.90%(±1.65),ROC-AUC和F1分数分别为0.94(±0.02)和0.94(±0.02)。其他三种增强技术——节点扰动、边扰动和Louvain采样——产生的结果在基线范围内,表明它们在这种情况下的影响很小。相比之下,胡萝卜数据集对结构扰动反应最为积极:在这里,节点和边扰动技术产生了最高的整体准确率78.62%(±2.93),ROC-AUC为0.79(±0.03),F1分数为0.80(±0.02),紧随其后的是Louvain采样,准确率为78.69%(±1.96),ROC-AUC为0.79(±0.02),F1分数为0.78(±0.03)。对于BOTCAST特征集,节点和边扰动技术再次提供了最高的准确率78.21%(±1.27),而距离阈值采样和随机游走采样增强策略在基线GNN上仅显示出适度的改进。表4 使用数据增强与否获得的GNN在疾病发生预测方面的结果,包括准确率、ROC-AUC和F1分数。全尺寸表格 图6 使用洋葱(A)、生菜(B)和胡萝卜(C)完整数据集训练的考虑GNN模型的ROC曲线。图中显示了每个模型的AUC ROC值。模型按其AUC性能的降序排列。时间预测和稳健性实验 在模型评估之后,我们进行了每日预测,以追踪每种作物考虑的个别植物疾病状态(见图7)。在完整和BOTCAST特征集上训练的模型通常很好地跟踪了观察到的真菌感染率(实线)——特别是对于使用完整数据的生菜(图7C)以及使用完整和BOTCAST数据的胡萝卜(图7E和F)。图7 这张图像的替代文本可能是使用AI生成的。全尺寸图像 应用表现最佳的GNN模型来预测洋葱(A和B)、生菜(C和D)和胡萝卜(E和F)植物疾病的发生。左侧的三个图表(A、C、E)基于使用包含所有可用生物和气象变量的完整特征集训练的模型结果,而右侧的三个图表(B、D、F)则基于使用减少的特征集(5-8个变量)训练的模型结果,这些特征集的选择旨在反映BOTCAST预测系统(Sutton等人,1986年)的逻辑。虚线代表五个独立训练模型的平均值±标准差曲线。实线代表实地观察到的实际疾病发生水平。然而,可以注意到一些预测误差。例如,在洋葱数据中,图神经网络(GNNs)在早期疾病检测方面遇到了挑战,在第166天和第173天左右低估了感染率(见图7A和B)。尽管在生菜数据上总体准确,但GNNs在疾病初期爆发阶段倾向于高估感染率——尤其是在第224天到第230天之间(见图7C和D)。同样,胡萝卜的预测与实地观察结果非常接近,尽管完整特征集模型在第202天到第207天之间略微高估了感染率(见图7E)。此外,还评估了GNNs对不完整和噪声数据的鲁棒性,以评估其在实际田间条件下的实用性。如图8A所示,基于图的架构——利用节点间的信息传递——显示出对特征屏蔽的显著抵抗力(见图3B,了解噪声和稀疏数据下的抵抗力)。尽管基线预测(无屏蔽)在第176天和第216天有轻微的不准确性,但它成功捕捉到了总体感染趋势:疾病发病率在早期上升,随后在第216天到第225天左右达到平台期并下降。值得注意的是,即使在推理过程中屏蔽了高达75%的节点特征,模型仍能保持这种预测模式——突显了其通过关系上下文补偿缺失数据的能力。
图8
这张图片的替代文本可能是使用AI生成的。
完整尺寸图片
缺失和噪声数据对GNN模型预测能力的影响。展示了在洋葱数据上训练的GNNs的结果(无特征噪声的结果对应于使用完整洋葱数据集获得的最佳GNN结果)。根据预测过程中屏蔽的特征比例(A中:0%、25%、50%、75%和90%的原始特征被屏蔽)以及被噪声值替换的特征比例(B中:0%、25%、50%、75%和90%的原始特征受到噪声影响),展示了每个采样日的感染植物比例。
另一个平行实验是在数据中引入合成噪声而不是进行屏蔽(见图8B)。在这种情况下,即使有高达50%的特征被噪声值替换,模型仍保持了其预测趋势。然而,当噪声水平达到75%时,性能明显下降,表明存在一个实际阈值,超过这个阈值后,信号退化开始超过模型从邻域信息中泛化的能力。
讨论
本研究评估了图神经网络(GNNs)在预测作物中真菌疾病发生方面的可行性和优势,结合了基于图的数据表示、图神经网络架构和图增强技术。在包含洋葱、生菜和胡萝卜真菌疾病发生情况的三个数据集中的结果表明,GNNs的表现优于传统的机器学习和深度学习模型,并且在噪声和不完整数据条件下具有鲁棒性。
我们研究中的第一个考虑因素是数据编码策略,它使我们能够将农业侦察观察的生物学现实表示为图。使用每块田地25株植物,并设置固定的25米边创建距离阈值,为我们提供了良好的输入数据表示,GNNs能够有效地利用这些节点之间的连通性来学习空间信息。虽然这些设置使我们能够捕捉到B. squamosa、B. lactucae和C. carotae的有意义的传播模式,但不同的病原体可能需要不同的距离阈值。然而,较小的阈值可能会模糊边的生物学解释,而较高的阈值可能会导致错过相关相互作用的风险。传统的“W”形采样模式也会留下田地的显著部分未被采样,可能排除重要的疾病传播区域。随着新的成像技术(如无人机UAV)和适当的疾病检测模型(Weiss等人,2020年)的出现,诸如泊松盘采样之类的替代采样方案可能通过确保采样植物之间的最小间距来提供更好的覆盖率和随机性平衡。这种设计选择很重要,因为它直接决定了信息传递操作的图拓扑结构。尽管基线预测(无屏蔽)在第176天和第216天有轻微的不准确性,但它成功捕捉到了总体感染趋势:疾病发病率的早期上升,随后在第216天到第225天左右达到平台期并下降。值得注意的是,即使在推理过程中屏蔽了高达75%的节点特征,模型仍然保留了这种预测模式——突显了其通过关系上下文补偿缺失数据的能力。
图8
这张图片的替代文本可能是使用AI生成的。
完整尺寸图片
缺失和噪声数据对GNN模型预测能力的影响。展示了在洋葱数据上训练的GNNs的结果(无特征噪声的结果对应于使用完整洋葱数据集获得的最佳GNN结果)。根据预测过程中屏蔽的特征比例(A中:0%、25%、50%、75%和90%的原始特征被屏蔽)以及被噪声值替换的特征比例(B中:0%、25%、50%、75%和90%的原始特征受到噪声影响),展示了每个采样日的感染植物比例。
另一个平行实验是在数据中引入合成噪声而不是进行屏蔽(见图8B)。在这种情况下,即使有高达50%的特征被噪声值替换,模型仍保持了其预测趋势。然而,当噪声水平达到75%时,性能明显下降,表明存在一个实际阈值,超过这个阈值后,信号退化开始超过模型从邻域信息中泛化的能力。
讨论
本研究评估了图神经网络(GNNs)在预测作物中真菌疾病发生方面的可行性和优势,结合了基于图的数据表示、图神经网络架构和图增强技术。在包含洋葱、生菜和胡萝卜真菌疾病发生情况的三个数据集中的结果表明,GNNs的表现优于传统的机器学习和深度学习模型,并且在噪声和不完整数据条件下具有鲁棒性。
我们研究中的第一个考虑因素是数据编码策略,它使我们能够将农业侦察观察的生物学现实表示为图。使用每块田地25株植物,并设置固定的25米距离阈值来创建边,为我们提供了良好的输入数据表示,GNNs能够有效地利用这些节点之间的连通性来学习空间信息。虽然这些设置使我们能够捕捉到B. squamosa、B. lactucae和C. carotae的有意义的传播模式,但不同的病原体可能需要不同的距离阈值。然而,较小的阈值可能会模糊边的生物学解释,而较高的阈值可能会导致错过相关相互作用的风险。传统的“W”形采样模式也会留下田地的显著部分未被采样,可能排除重要的疾病传播区域。随着新的成像技术(如无人机UAV)和适当的疾病检测模型(Weiss等人,2020年)的出现,诸如泊松盘采样之类的替代采样方案可能通过确保采样植物之间的最小间距来提供更好的覆盖率和随机性平衡。这种设计选择很重要,因为它直接决定了信息传递操作的图拓扑结构。尽管如此,我们的结果表明,即使是非最优的采样技术也足以获得高预测性能。通过选择不太严格的边确定方法(例如使用边权重来增加邻近节点的重要性并减少信息传递过程中远距离植物节点的影响),可以进一步缓解这一问题。
图节点特征的选择是我们研究的另一个关键因素。在完整特征集(约130个变量)上训练的模型通常比在减少的BOTCAST启发式特征集(5到8个变量)上训练的模型表现更好。这表明,访问更丰富的环境和生物变量池为GNNs提供了更好的机会来提取有意义的表示。同时,GNNs在两种特征模式下都表现出显著的稳定性(见表2;图7),而其他模型则显示出更大的变异性。这表明GNNs中的关系归纳偏差可以通过利用邻近节点信息来补偿缺失或不相关的变量。鲁棒性实验支持这一解释:即使屏蔽了75%的特征或用噪声替换了高达50%的特征,GNNs仍然能够跟踪总体感染动态(见图8)。这一属性在农业环境中尤为重要,因为传感器故障或缺失的侦察数据很常见。
在将GNNs与传统的机器学习和深度学习方法进行比较时,出现了一些模式。对于洋葱数据,随机森林分类器在完整特征集上的表现略优于GNN(见表2)。这一结果与先前的研究结果一致,即当信息丰富的特征已经被设计出来时,基于树的集成模型可以表现得特别好,因为它们能够有效地捕捉非线性阈值,而不依赖于关系结构(Petković等人,2022年)。对于生菜和胡萝卜数据,GNNs获得了最高的准确性、ROC-AUC和F1分数(见表2和4),表明关系建模对这些作物有利。最近在其他农业预测任务中也报告了类似的好处(Gupta & Singh,2023年;Lu等人,2025年)。训练和验证GNN曲线(见图5)确认了稳定的收敛性,没有过拟合的可能性。
图增强引入了另一层性能提升。随机游走采样对洋葱和生菜数据集特别有效,而节点和边的扰动以及Louvain聚类对胡萝卜数据集产生了更强的结果。不同增强方法对不同作物的影响表明,它们的效用可能取决于所考虑的具体疾病。例如,随机游走生成了可能反映短距离传播过程的局部子图,而扰动和聚类则强调了更广泛的社区结构,这可能与斑块状或聚集的疾病动态更为一致。这通常与更广泛的证据一致,即增强策略通常需要根据领域和数据几何形状进行定制(Ding等人,2022年)。结果的异质性强调了需要谨慎选择增强策略,而不是假设它们的普遍好处。
尽管获得的GNN预测结果令人鼓舞,但仍需注意几个限制。对于从头开始训练GNNs,每块田地25株植物的相对较小样本量和每周的监测频率限制了图的空间和时间分辨率。这些限制可能导致了洋葱数据上的性能较弱,以及图7(A-D)中观察到的早期季节的过高和过低估计。二元标签也简化了疾病严重程度的谱,并在训练期间加剧了类别不平衡,特别是在症状植物稀少的早期生长阶段。由于数据来自一个地区的单个生长季节,外部有效性仍然不确定。需要进行多季节和多区域的研究来评估GNN的泛化能力,特别是因为基于规则的模型和ML模型通常在没有重新校准的情况下无法泛化。然而,值得注意的是,转移学习方法已被证明对使用GNNs预测真菌疾病发生有益,这可能有助于促进作物和真菌物种之间的泛化(Samson等人,2025年)。
一个特别有前景的方向可能是从同质图转向异质节点GNNs。未来的图不仅可以表示植物,还可以包括气象站、孢子陷阱、管理事件(例如灌溉或喷洒)和各种传感器作为不同的节点类型,用类型的边来编码它们的相互作用(例如,风信息传播、径流连通性或植物-植物接近性)。跨异质节点的信息传递可以:(i)在推理时融合多模态证据,提高植物级数据稀疏时的鲁棒性(Wang等人,2021年;Peng等人,2024年);(ii)通过分离影响植物-疾病动态的不同驱动因素来区分图组件;(iii)通过代表可操作杠杆的边来支持查询(例如,“如果喷洒延迟两天,预测的影响是什么?”)。结合探索时间图模型的可能性,这将使表示更紧密地符合真菌疾病传播和管理的机制。时间GNNs特别设计用于捕捉图随时间的演变结构和节点状态的顺序依赖性,使它们非常适合模拟连续几天有利天气下感染风险的建立以及流行病在田地内的空间变化。在农业背景下研究这些模型可以提供更丰富和更机制化的疾病进展预测(Wu等人,2021年;Lu等人,2025年)。
虽然当前模型依赖于个体植物级别的观察结果和天气衍生特征,但也可以在更粗的空间分辨率(如地块、农场或区域级别)生成预测,这取决于可用的数据和具体用例。通过无人机成像可检测的真菌疾病在这方面特别有前景,因为空中指标可以替代或补充人工侦察,研究这些输入是否产生可比的预测性能将是未来研究的一个有价值的方向(Chin等人,2023年)。
总的来说,这些发现表明,GNNs在预测作物中的真菌疾病方面提供了可测量的优势,特别是在关系和空间动态对病原体传播至关重要的情况下。它们在特征减少的情况下有效运行、容忍噪声和缺失数据的能力,以及可能的图增强的好处,使它们成为集成到精准农业决策支持系统中的有力候选者。同时,这些模型的成功在很大程度上取决于图设计、采样策略和特征选择,以及底层的机器学习架构。此外,向异质和时间图模型的扩展尤其有前景,因为这些方法可以捕捉作物-病原体-环境-管理相互作用的更广泛生态,并提供更好的疾病进展机制化预测。
结论
本研究表明,图神经网络(GNNs)是预测农业领域真菌疾病发生的实用且有效的方法。通过将植物表示为通过空间邻近性连接的节点,并用天气和植物级别的属性丰富每个节点,GNNs在三种不同作物上通常优于机器学习和深度学习基线,同时在不完整和噪声输入下仍具有鲁棒性。图增强策略进一步提高了GNN在所有三个作物数据集上的性能,表明图表示和信息传递程序非常适合建模植物-真菌疾病发生。这些结果共同表明,明确建模空间关系可以产生比独立处理观察结果的方法更稳定和操作上更有用的预测。
本研究的一个重要限制是数据是在单个生长季节收集的。尽管我们的数据集很广泛,包括多种作物,但真菌疾病的动态受到每年变化很大的天气条件的强烈影响。因此,训练出的预测模型可能反映了2021年观察到的特定气候条件下的模式。温度、湿度和降水的这种变化可能会显著影响疾病动态,从而可能影响模型在不同季节的泛化能力。未来的工作应该跨多个生长季节和地理区域评估这些模型,以更好地评估它们的泛化能力。我们的结果表明,模型的预测性能取决于塑造生物保真度的选择——采样设计、图神经网络构建和特征可用性。固定距离的边和每周的监测数据为研究提供了可行的数据集,但仍然无法完美地模拟疾病传播的路径。此外,二进制标签简化了疾病严重程度的信息,而这本可以更精确地评估风险。这些局限性表明,未来有明显的机会开发出性能更优的支持系统,例如改进采样方法或探索多类预测任务。将图神经网络(GNN)与时间序列模型(如长短期记忆网络GNN-LSTM)相结合的混合架构是一个特别有前景的方向,因为它们能够明确捕捉感染风险在连续时间段内的变化情况。总体而言,GNN为精准农业中的疾病预测奠定了坚实的基础。将其扩展到异构的、动态的图结构中是自然而然的下一步,这样可以全面反映作物-病原体-环境-管理之间的相互作用,提高模型的泛化能力,并为及时、有针对性的干预措施提供更实用、更高效的数据支持。