摘要
目的
本研究旨在通过将全文文章转换为机器可读的元数据,并利用这些元数据来追踪传感器、指数、分析技术和应用方面的领域趋势,从而确定基于无人驾驶飞行器(UAV)的小麦研究的方法论格局。
方法
研究人员整理了一组最新的研究文献,并提取了四个领域的方法论信息:传感器、指数、技术和应用。所建立的流程使用了一个精心策划的词汇表进行自动标注,该词汇表通过上下文线索(如索引标记、波段名称、波长提及和附近的公式表示)来增强别名的覆盖范围。通过使用周围文本进行零样本自然语言推理来解决诸如缩写冲突之类的歧义问题。通过迭代的人工检查设置了特定类别的相似性阈值(传感器:0.55;指数:0.50;技术:0.50)。在汇总之前,所有检测结果都进行了规范化处理,以防止拼写变体和别名的重复计数。
结果
所得到的元数据支持跨领域的领域级总结和比较分析。从实证来看,该领域已经从使用易于获取的RGB工作流程发展到多光谱和高光谱传感技术,机器学习的采用率不断提高,同时对应用方面的关注也在增加,包括生长监测、产量估算、疾病检测、表型分析和倒伏评估等。
结论
通过发布每篇论文的完整清单和完整的标注词汇表作为补充材料,本研究为监测方法论趋势提供了可复现的基础,并为发展基于UAV的农学研究提供了通用的参考框架。
影响
本研究通过将非结构化的UAV小麦研究文章转换为可分析的元数据,实现了文献规模的知识提取,为选择传感器、指数和分析方法提供了基于文献的指导。该框架为基准测试和方法论参考提供了可复现的基准。
引言
无人驾驶飞行器(UAV)已成为现代精准农业中不可或缺的工具,能够提供高分辨率的按需数据,从而详细观察作物生长和空间变异性(Aierken等人,2024;Toscano等人,2024;Zambrano等人,2023)。与传统卫星或地面传感系统相比,UAV具有更好的时间灵活性和空间分辨率,使研究人员能够在整个生长季节监测作物的细微生理和结构变化(Allu & Mesapam,2025;Bazrafkan等人,2025;Phang等人,2023)。随着数据采集技术的进步,基于UAV的遥感技术被越来越多地用于量化植被特征、评估产量潜力以及检测不同种植系统中的环境或管理相关压力(Dong等人,2024;Kefauver等人,2017;Khodjaev等人,2024;Zhu等人,2024)。在主要作物中,小麦(Triticum aestivum L.)因其在全球粮食安全中的重要性以及对环境和农艺因素的敏感性而受到特别关注(Sadeh等人,2025;Sharma等人,2024)。配备多光谱、高光谱、热成像或RGB传感器的UAV平台已被广泛用于评估小麦生长动态、估算生物量和产量,并评估谷物质量属性,如蛋白质含量(Koh等人,2022;Kyratzis等人,2017;Panwar等人,2024)。将植被指数(如归一化差异植被指数(NDVI)、归一化差异红边指数(NDRE)和土壤调整植被指数(SAVI)与统计和机器学习模型相结合,提高了对小麦生理和表现的表征能力。这些进步共同扩展了UAV遥感在小麦研究中的分析潜力,使得生物物理和生化特征的定量评估成为可能(Camenzind & Yu,2024)。
然而,尽管取得了这些成就,当前基于UAV的小麦研究领域仍然存在碎片化和方法论上的异质性。许多研究集中在特定目标或孤立元素上,如特定传感器、植被指数或分析技术(Bongomin等人,2024;Volpato等人,2021)。因此,传感器、植被指数和分析框架之间的相互联系尚未系统地绘制出来,使得该领域的整体方法论演变不够清晰。尽管有几篇综述文章总结了UAV辅助表型分析和作物监测的进展,但这些研究通常依赖于人工策划的文献和叙述性解释。这种方法在可复现性、可扩展性和定量严谨性方面存在固有的局限性,尤其是在基于UAV的农业研究量持续快速增长的情况下(Moraes等人,2023;Ndlovu等人,2024)。传统的文献计量分析试图解决这些局限性,但它们通常依赖于标题、摘要或作者关键词等元数据,忽略了全文文档中嵌入的丰富上下文信息(Rejeb等人,2022)。因此,对UAV研究中传感模式、植被指数、分析技术和应用目标共同演变的理解仍然不完整。因此,需要一种系统化的、数据驱动的方法来直接从科学论文中提取和组织方法论知识,以建立对该领域更全面的概述(Shahi等人,2022;Strzępek等人,2023)。
自然语言处理(NLP)和光学字符识别(OCR)技术的最新发展为自动化大规模文本分析和知识提取提供了新的机会(Dhanya等人,2022)。OCR能够将研究论文转换为机器可读文本,而NLP技术可以识别大型语料库中的有意义模式、共现关系和语义关联。这些技术的整合使得创建描述研究内容的结构化元数据成为可能(Zhu等人,2025)。尽管这些自动化方法在生物医学和环境领域得到了越来越多的应用,但在农业遥感中的应用仍然很少(Istiak等人,2023)。特别是,目前还没有研究系统地将OCR和NLP应用于基于UAV的文献,以识别和构建关键的方法论组成部分。
本研究通过实施一个由OCR和NLP支持的元数据分析流程,来组织2015年至2025年间发表的关于在田间条件下表征小麦生长和生理的UAV应用文献,从而填补了这一研究空白。与主要依赖于标题、摘要、作者关键词和引用元数据的传统文献计量或科学计量分析不同,本研究的方法直接从研究文章的全文中提取方法论信息。这使得能够识别出个别研究中方法论描述中嵌入的传感器、植被指数、分析技术和应用目标之间的关系。因此,当前框架侧重于构建基于UAV的小麦研究的方法论格局,而不是分析出版物或引用模式。
这里采用的方法自动从OCR处理后的全文文档中提取和分类信息,分为四个主要维度:传感器、指数、技术和应用。然后对这些元数据进行分析,以评估覆盖范围、共现模式、时间动态和聚类关系。本研究为过去十年基于UAV的小麦研究的方法论结构提供了全面且可复现的框架。通过定量描述传感技术、植被指数、分析方法和应用目标之间的相互作用,本研究为基于UAV的遥感在小麦研究中的演变提供了数据驱动的视角。预计这些结果将有助于未来的方法论基准测试,指导田间实验中的传感器和指数选择,并支持设计用于精准作物监测的集成分析框架。此外,本研究还符合农业科学向人工智能辅助的知识发现以及可发现(Findable)、可访问(Accessible)、可互操作(Interoperable)和可重用(Reusable,FAIR)数据原则的转变。随着数字农业越来越依赖于透明、机器可读和可互操作的数据集,自动化元数据提取已成为确保研究结果能够在不同学科之间有效链接、重用和分析的关键步骤。这里提出的框架展示了如何结合OCR和NLP来构建一个符合FAIR标准的知识基础设施,连接遥感数据、分析技术和农艺成果。本研究不仅组织了过去的基于UAV的小麦研究,还为下一代数据驱动的农业智能建立了方法论基础。
方法论
本研究开发的工作流程旨在创建一个完全自动化的系统,用于从基于UAV的小麦研究论文中提取、结构化和分析方法论元数据。为了确保透明度、可复现性和可扩展性,构建了一个流程,在该流程中仅使用R进行数据收集,而所有后续步骤(包括文档处理、文本的光学字符识别以及使用自然语言方法的元数据标注)均在Python中完成,所有脚本都在安装了R 4.5.0和Python 3.10的Windows 11 64位工作站上执行。
该框架包括五个连续阶段:数据收集、基于OCR的文本提取、元数据标注、数据组织和质量评估以及可视化。这些阶段共同构成了一个连续的数据流程,将原始研究论文转换为适合定量分析的结构化元数据(图1)。
图1
此图像的替代文本可能是使用AI生成的。
元数据驱动分析流程的工作流程
开发工作使用Visual Studio Code进行,该环境允许两种语言在集成环境中运行。依赖关系通过专用的Conda环境进行管理,以支持跨机器的可复现性,R和Python都使用了特定版本的库。全局随机种子未固定。通过精确的软件版本控制、配置控制和模型特定的种子(如果可用)来确保可复现性;重复运行产生了稳定的汇总结果。R用于数据收集,包括欧洲PMC REST API查询、分页、JSON解析以及书目元数据的初步规范化。Python用于文档处理和分析,包括PDF图像转换、基于OCR的文本提取、使用自然语言方法的元数据标注、机器学习、图像分析和可视化。跨语言设计充分利用了每种语言的优势,整个工作流程完全自动化,使得每个阶段都能生成标准化的中间输出,供下一个阶段无需人工干预即可使用。
数据收集
工作流程的第一阶段涉及系统地、基于标准检索应用UAV在田间条件下分析小麦生长和生理的同行评审研究。文献通过欧洲PMC数据库的RESTful API接口进行收集。选择欧洲PMC是因为它提供了对结构化书目元数据的稳定程序化访问,包括数字对象标识符(DOI)、出版年份、期刊信息和作者记录,从而实现了完全可复现的文献检索和与自动化下游处理的无缝集成。其对生命科学和农学相关出版物的索引进一步便于与OCR分析所需的全文来源进行链接。然而,与商业书目数据库相比,欧洲PMC对某些工程或遥感相关期刊的覆盖范围可能不够全面,这在对结果语料库的解释中予以考虑。
文献搜索涵盖了2015年至2025年的时期。检索查询结合了与UAV相关的术语和与小麦相关的关键词,具体包括“drone”或“UAV”与“wheat”或“Triticum”。该查询旨在平衡精确性和可复现性。由于下游的OCR和元数据标注过程对偏离主题的检索敏感,因此搜索策略优先考虑了基于田间的UAV-小麦研究的特异性,而不是最大化所有航空传感术语的召回率。虽然考虑了更广泛的UAV相关同义词(如UAS、RPAS)和小麦特定变体(如Triticum aestivum)作为潜在的敏感性扩展,但保留了基线查询,以确保在明确定义的范围内进行一致、可审计的检索。API响应以JSON格式返回,并在R中汇总,形成结构化的书目数据集。使用httr和jsonlite包(Ooms,2014),查询被分页迭代进行,以确保所有匹配记录都被包含在内。根据预先定义的纳入和排除标准,排除了重复记录、综述文章和非英文出版物,仅保留了报告基于无人机(UAV)的小麦生长或生理学野外研究的原始研究文章。尽管搜索时间范围是从2015年到2025年,但在2017年之前没有找到符合纳入标准的合格全文野外研究。这种模式可能反映了2017年之前无人机平台在小麦田间实验中的有限应用,以及早期无人机文献的术语和索引限制。因此,所策划的语料库代表了2017年及以后发表的研究,这对应于基于无人机的农学研究快速扩展的时期。最初确定了85条候选记录。经过标题和摘要级别的筛选,去除了明显偏离主题的研究(n=5条),然后对80条记录进行了全文适用性和OCR处理的评估。根据全文可用性和OCR衍生的质量标准进行过滤后(文本量不足,“Low_text”,n=5条;元数据覆盖不足,“Low_meta”,n=1条),最终保留了74项研究用于分析。整个检索和筛选过程在PRISMA风格的流程图中进行了总结(图2),该图记录了每个阶段的记录纳入和排除情况。
图2
此图像的替代文本可能是使用AI生成的。
全尺寸图像
本研究中使用的文献检索、筛选、适用性评估和最终纳入过程的PRISMA风格流程图
为了支持后续的OCR工作流程,根据DOI引用手动下载了每篇保留的文章,并将其组织成标准化的顺序命名系统(001、002、003等)。这确保了文献记录和文档文件之间的一致性一一对应,从而实现了无需人工文件级干预的完全自动化下游处理。所有的OCR和元数据标记都是在记录级别进行的,以保持可重复性和可审计性。
在数据库中,如果预印本及其同行评审版本或同一研究的标题变体作为单独条目出现,这些记录被有意保留为不同的单元。这一决定保持了记录级别的透明度,并允许对所有索引条目中的OCR和元数据标记结果进行可追溯的评估。
为了提供分析研究的区域分布概况,根据第一作者的机构隶属关系确定了每篇文章的来源国家。这些信息仅用于描述性总结地理研究分布,而不是用于详细的空间分析(补充表S1)。
基于OCR的文本提取
数据收集后,所有PDF文档都被转换为高分辨率图像文件以便进行OCR处理。转换过程使用了Python中的pdf2image库,将PDF的每一页转换为300 dpi分辨率的图像(Bishara等人,2025年;Pisaneschi等人,2023年)。经过初步试验后,确定这一分辨率在文本识别准确性和计算成本之间取得了平衡。转换利用了Poppler渲染引擎,每篇论文自动保存为与原始页面顺序对应的编号图像文件序列。
在OCR处理之前,对图像进行了增强以提高识别准确性。页面图像被转换为灰度图像,放大1.6倍以清晰显示细小文本,并使用OpenCV中的自适应高斯阈值处理(Bouillon等人,2019年;Rehman & Haroon,2023年)。这增加了文本和背景之间的对比度,并减轻了纸张质量变化、嵌入图形和扫描伪影的影响。预处理后的图像随后使用Tesseract OCR引擎(版本5.5.0)进行处理,该引擎配置为支持Unicode的英语识别。
OCR输出最初是包含相关内容和外围元素(如页眉、页脚和图表标题)的原始文本。应用了自定义规则来自动去除无关部分,专注于每篇论文的主体内容。具体来说,脚本识别了“材料与方法”(或类似标题如“数据与方法”)和“参考文献”之间的文本区域,仅保留论文的实质性内容。参考文献、致谢和附录被排除在本研究之外。
提取后,文本被标准化以纠正与OCR相关的常见错误,例如将NDV1替换为NDVI并解决误读的特殊字符。精炼后的语料库被保存为UTF-8编码的纯文本文件,作为元数据标记阶段的基础。这种标准化使得所有文档的分析具有一致性,无论原始格式或期刊模板如何。
元数据标记
补充表S3提供了用于OCR和标记的记录级清单。在这个清单中,ID 53(2023年发表的预印本)和ID 79(2024年发表的记录版本)对应于同一研究,并被有意保留为不同的记录。ID 72和80指的是同一研究;标题字符串的变体导致在收集过程中出现了单独的条目。这两个条目都被记录下来,它们的关系显示在补充表S3中。
与依赖结构化文献元数据的计量学研究不同,本研究中的标记程序直接操作基于OCR的全文内容,从而可以直接从研究文章的主体中检测方法学元素。第四阶段涉及自动元数据标记,通过从全文中提取结构化信息,将关键方法学元素分类到四个领域(传感器、索引、技术和应用),以便定量总结基于无人机的小麦研究中的方法学模式。标题和正文中提到的传感器被检测并映射到涵盖RGB、多光谱、高光谱、热成像和LiDAR系统的规范标签。
植被指数检测使用了带有别名覆盖和上下文感知提示的策划词典。它识别了广泛使用的指数,如NDVI、NDRE和SAVI,并将来自可见光波段的指数(如Excess Green、Visible Atmospherically Resistant Index和Triangular Greenness Index)与依赖于红色、红边和近红外信息的光谱指数区分开来。消歧使用明确的指数标记、波段名称(如红色、绿色、蓝色、红边和近红外)、以纳米表示的波长提及,以及来自周围公式符号的提示,在聚合之前将所有检测结果标准化为规范的植被指数名称;完整的别名列表和模式说明提供在补充表S2中。
技术标记涵盖了传统统计和现代机器学习,并将缩写词映射到规范标签,包括部分最小二乘回归(PLSR)、多元回归、支持向量机、卷积神经网络和基于Transformer的模型。应用领域涵盖了研究目标,如产量估计,由于这些术语通常是抽象的,因此流程分析了标题和正文的前三句话以恢复意图。
为了在保持覆盖范围的同时减少OCR噪声下的误报,标记使用了两阶段设计,结合了基于规则的评分和别名词典以及上下文提示,随后在短局部上下文中进行零样本语义验证。在第一阶段,候选标记与策划的词汇表进行软匹配,并使用包括明确指数标记波段名称(如红色、绿色、蓝色、红边和近红外波长提及)的上下文信号进行评估,以及来自周围公式符号的提示,以便常见的OCR替换截断和连接仍然产生带有位置和分数的临时标签。
在第二阶段,基于Facebook Bart大型MNLI模型的自然语言推理分类器读取附近的文本范围,并测试它是否包含目标标签,从而在上下文中解决缩写词冲突。在关于模型训练交叉验证或特征重要性的句子中确认随机森林,而在传感器或遥测上下文中拒绝射频。通过迭代手动检查样本文档和常见的OCR错误模式设置了特定类别的阈值,而不是通过优化精确度和召回率指标。最终值分别为传感器0.55、索引0.50和技术0.50。
当缺乏明确的传感器证据时,来自可见光波段的指数默认映射到RGB,而光谱指数需要波段或波长上下文进行确认。所有检测结果在聚合之前都进行了规范化,以防止由于别名和拼写变体导致的重复计数。这里报告的词典阈值和启发式规则与实施的流程相匹配,并在补充表S2中提供,以确保完全的可重复性。
在光学字符识别和自动标记之后,应用了反映实际文本可用性和标记覆盖范围的质量过滤器。在收集时,语料库包含85项候选研究,在排除偏离主题的项目和标记低文本(OCR文本量不足,小于10 KB)和低元数据(检测到的类别少于两个)的情况后,保留了74篇论文用于分析。表1总结了纳入结果和质量标志,完整的每篇论文清单及其定义提供在补充表S3中。
表1 语料库总结和质量标志(N=85)
全尺寸表格
在整个74篇论文的分析集中应用了记录级别的决策;预印本-期刊(ID 53和79)和标题-变体(ID 72和80)对在补充表S3中进行了映射。低文本表示通过光学字符识别恢复的正文量不足,低元数据表示四个标志类别中的标记覆盖稀疏。这些标志用于质量级别的子集分析。
自动标记依赖于带有别名覆盖和上下文提示的策划词典,所有检测结果在聚合之前都被映射到规范标签。表2提供了按类别划分的词典的简要概述,以及完整的别名列表和模式说明提供在补充表S2中。
表2 自动元数据提取中使用的标记词典概述
全尺寸表格
当缺乏明确的传感器证据时,类似RGB的植被指数默认映射到RGB,而光谱指数需要波段或波长上下文进行确认。在聚合之前使用规范名称以避免别名和拼写变体的重复计数。
规范标签基于无人机遥感文献中常用的术语选择。对于每个元数据类别,定义了代表性的规范术语,如植被指数的NDVI或分析技术的随机森林,并将频繁观察到的别名、缩写或拼写变体映射到相同的规范标签。这一步骤确保了在元数据分析过程中语义等效术语的一致性聚合,同时防止了由于替代表达方式导致的重复计数。
为了验证基于OCR的元数据提取的可靠性,使用最终语料库中随机选取的十篇文章进行了手动验证。对于这些论文,方法学元数据类别(传感器、索引、技术和应用)被手动注释,并与OCR-NLP流程生成的标签进行了比较。
因为单个文章中可能出现多个元数据元素,所以验证侧重于类别级别的检测,而不是个别标签的精确枚举。当至少一个手动注释的元数据元素被自动标记系统正确识别时,认为检测成功。验证结果总结在表3中。
表3 手动注释和基于OCR的元数据检测之间的比较
全尺寸表格
最终,处理后的文本和检测到的标签被整合到一个表格数据集中,捕获了四个类别中的关键词:传感器、索引、技术和应用。每条记录都获得了方法中定义的质量标志,并显示在表1中。完整的每篇论文清单显示在补充表S3中。这些标志用于质量级别的子集分析。
随后的可视化和总结分析是在Python中进行的,通过将标记的元数据整合到图表中完成的。定量总结,包括类别覆盖、关键词频率和共现关系,以条形图、弦图和热图的形式呈现。时间分析展示了2017年至2025年间传感器、植被指数和分析技术的年度趋势。进行了聚类和主成分分析(PCA),以识别论文之间的方法学关联模式,词云提供了每个簇中主导研究术语的简洁概述。
结合的输出为农业遥感的大规模文献综合建立了一个可复制和可扩展的框架。通过将文本研究内容转换为结构化和可分析的数据,该流程揭示了在非结构化文本中难以观察的方法学关系和时间模式。
OCR和元数据标记准确性的验证
使用从数据集中随机选取的十篇代表性论文,评估了基于OCR的文本提取和元数据标记的总体准确性和一致性。样本涵盖了不同的出版年份、期刊格式和文档布局,以测试在异构条件下的鲁棒性。对于每篇论文,文本量都成功提取出来,并且手动检查了“材料与方法”部分的完整性以及正确识别的元数据项的数量,并将其与自动生成的输出进行了比较。OCR程序从几乎所有分析的论文中提取出了可读且结构良好的文本。除了少数质量较低的扫描PDF文件外,识别出的文本保持了原始的章节顺序和段落连贯性。预处理通过三个步骤提高了文本的清晰度,无论布局和打印质量如何。首先,转换为灰度图像去除了颜色伪影并标准化了光照,从而清晰了低对比度的线条并减少了背景阴影。其次,将图像放大1.6倍,增加了细小字符边缘的像素支持,提高了小字体的可读性,并稳定了后续对变音符号和标点符号的识别。第三,自适应高斯阈值使用高斯加权邻域为每个像素计算出一个局部变化的阈值,从而将前景文本与不均匀的背景分开,减轻了渗透效应,并减少了阴影和扫描仪噪声的影响。在排除了与主题无关的项目和低质量案例(文本或元数据较少)后,超过95%的集合提供了足够质量的文本,可用于后续的元数据分析。这一比例对应于筛选集合中质量标志为“OK”的项目所占的比例,并在补充表S3中进行了总结。这一覆盖水平表明,基于OCR的提取框架是可靠的,并且可以应用于多种出版类型和格式。
元数据标记性能通过检测到至少一个相关关键词的论文比例来评估,这些关键词分别属于四个类别:传感器(Sensor)、植被指数(Vegetation Index)、技术(Technique)和应用(Application)(图3)。两个类别的覆盖率超过了80%,其中传感器的检测率最高,约为96%,其次是应用,为80%;技术(Technique)和植被指数(Vegetation Index)分别达到了约67%和53%。
图3:该图像的替代文本可能是使用AI生成的。
按类别(传感器、指数、技术和应用)标记的元数据覆盖率
这一发现反映了基于无人机的研究中传感器类型的频繁和明确报告。相比之下,植被指数术语的覆盖率最低,约为55%,这是因为指数报告方式存在很大差异,从NDVI和归一化差异红边指数(NDRE)这样的缩写到归一化差异植被(normalized difference vegetation)这样的描述性表达。尽管存在这种变异性,但模糊匹配和上下文验证的结合在文档中产生了合理的检测率。
技术和应用类别的覆盖率分别达到了约67%和80%。技术使用多种术语进行描述,如支持向量机(SVM)、SVM分类器和基于核的模型,其中模糊匹配算法被有效捕获。应用标记受益于上下文零样本分类,它将研究目标(如产量估计、生长监测和表型分析)与适当的元数据标签联系起来。这种语义推理步骤使得即使在没有明确关键词的情况下也能解释方法论意图。
总体而言,结果表明,结合OCR和NLP的集成流程实现了可靠的文本提取和稳健的元数据检测,适用于多种出版格式。不同类别之间的一致性能表明,非结构化的科学文档可以转换为适合大规模分析合成的结构化元数据。覆盖率上的轻微差异,特别是在植被指数领域,表明在未来迭代中有机会通过扩展特定领域的词汇来提高标记的完整性。
图4总结了每个元数据类别(传感器、指数、技术和应用)中检测到的最常见关键词,并报告了这些关键词至少出现一次的论文数量。条形图反映的是论文数量,而不是论文内的出现频率;因此,即使某个术语在文本中出现了多次,每篇论文也最多只贡献一个计数。这种表示方法突出了每种方法论元素在整个语料库中的采用程度。
图4:该图像的替代文本可能是使用AI生成的。
在传感器类别中,多光谱(Multispectral)和RGB系统占主导地位。44篇研究中提到了多光谱传感,31篇研究中提到了RGB传感。多光谱传感器的主导地位可能反映了它们捕捉窄光谱带的能力,特别是在红边和近红外区域,这些区域与作物生理特征(如叶绿素浓度、氮状态和冠层结构)密切相关。这些光谱特性使得多光谱图像特别适合用于基于植被指数的定量分析,特别是在小麦监测中。16篇研究中提到了高光谱传感器,12篇研究中提到了热传感,2篇研究中提到了LiDAR。从多光谱和RGB到其他模式,分布急剧减少,表明少数几种传感器类型占据了大多数研究,而专业或成本较高的传感器相对较少见。
总体而言,这种分布表明,实际的基于无人机的 wheat 监测主要围绕那些在田间条件下平衡了生理敏感性和操作可行性的传感器平台构建。
植被指数显示出广泛的分布,其中NDVI的引用频率最高,出现在52篇论文中,其次是RVI,出现在47篇论文中。第二梯队包括SR、SAVI和NDRE,分别出现在大约27到31篇论文中,而OSAVI和GNDVI分别出现在24篇和22篇论文中。MSR、TVI和DVI在18篇、18篇和17篇论文中提到的频率较低。这种排序表明,基于红边和近红外关系的指数(如NDVI、RVI和SR)仍然是主要选择,而经过土壤调整的变体(SAVI和OSAVI)以及对叶绿素敏感的形式(NDRE和GNDVI)形成了广泛使用的第二梯队。这一结果意味着,以小麦为导向的无人机研究优先考虑那些能够稳定表示冠层活力、背景土壤效应和叶绿素相关变化的指数。
在模型方法中出现了明显的层次结构。随机森林(Random Forest)位居榜首,出现在73篇论文中,为该领域树立了强有力的标杆。随机森林的主导地位可能反映了其在处理无人机衍生数据集时的稳健性,这些数据集通常包含非线性关系、植被指数之间的多重共线性以及中等样本量。这些特性使得集成树方法特别适合建模复杂的作物-光谱交互作用。其次是SVM,出现在26篇论文中,线性回归出现在22篇论文中,PLSR紧随其后,出现在20篇研究中。其他方法的使用则更为选择性。决策树出现在17篇论文中,卷积神经网络出现在14篇论文中,而其余的学习方法则较少使用:支持向量回归(SVR)出现在9篇论文中,极端梯度提升(XGBoost)出现在8篇论文中,最小绝对收缩和选择算子(LASSO)出现在5篇论文中,k最近邻(KNN)出现在3篇论文中。
总的来说,这些计数表明,集成流程结合了OCR和NLP,实现了可靠的文本提取和稳健的元数据检测,适用于多种出版格式。不同类别之间的一致性能表明,非结构化的科学文档可以转换为适合大规模分析合成的结构化元数据。覆盖率上的轻微差异,特别是在植被指数领域,表明未来迭代中有机会通过扩展特定领域的词汇来提高标记的完整性。
图4总结了每个元数据类别(传感器、指数、技术和应用)中最常见的关键词,并报告了这些关键词至少出现一次的论文数量。条形图反映的是论文数量,而不是论文内的出现频率;因此,即使某个术语在文本中出现了多次,每篇论文也最多只贡献一个计数。这种表示方法突出了每种方法论元素在整个语料库中的采用程度。
在传感器类别中,多光谱(Multispectral)和RGB系统占主导地位。44篇研究中提到了多光谱传感,31篇研究中提到了RGB传感。多光谱传感器的主导地位可能反映了它们捕捉窄光谱带的能力,特别是在红边和近红外区域,这些区域与作物生理特征(如叶绿素浓度、氮状态和冠层结构)密切相关。这些光谱特性使得多光谱图像特别适合用于基于植被指数的定量分析,特别是在小麦监测中。16篇研究中提到了高光谱传感器,12篇研究中提到了热传感,2篇研究中提到了LiDAR。从多光谱和RGB到其他模式,分布急剧减少,表明少数几种传感器类型占据了大多数研究,而专业或成本较高的传感器相对较少见。
植被指数显示出广泛的分布,其中NDVI的引用频率最高,出现在52篇论文中,其次是RVI,出现在47篇论文中。第二梯队包括SR、SAVI和NDRE,分别出现在大约27到31篇论文中,而OSAVI和GNDVI分别出现在24篇和22篇论文中。MSR、TVI和DVI在18篇、18篇和17篇论文中提到的频率较低。这种排序表明,基于红边和近红外关系的指数(如NDVI、RVI和SR)仍然是主要选择,而经过土壤调整的变体(SAVI和OSAVI)以及对叶绿素敏感的形式(NDRE和GNDVI)形成了广泛使用的第二梯队。这一结果意味着,以小麦为导向的无人机研究优先考虑那些能够稳定表示冠层活力、背景土壤效应和叶绿素相关变化的指数。
在模型方法中出现了明显的层次结构。随机森林(Random Forest)位居榜首,出现在73篇论文中,为该领域树立了强有力的标杆。随机森林的主导地位可能反映了其在处理无人机衍生数据集时的稳健性,这些数据集通常包含非线性关系、植被指数之间的多重共线性以及中等样本量。这些特性使得集成树方法特别适合建模复杂的作物-光谱交互作用。其次是SVM,出现在26篇论文中,线性回归出现在22篇论文中,PLSR紧随其后,出现在20篇研究中。其他方法的使用则更为选择性。决策树出现在17篇论文中,卷积神经网络出现在14篇论文中,而其余的学习方法则较少使用:支持向量回归(SVR)出现在9篇论文中,极端梯度提升(XGBoost)出现在8篇论文中,最小绝对收缩和选择算子(LASSO)出现在5篇论文中,k最近邻(KNN)出现在3篇论文中。
这些计数表明,集成树和经典回归作为主要技术受到普遍青睐,当问题结构或数据可用性使核方法和早期深度学习模型有利时,它们会被采用。这种层次结构表明,该领域倾向于选择那些在相对较小到中等规模的田间数据集下仍然可解释且稳定的技术,同时能够捕捉与农艺预测相关的非线性作物-光谱关系。
在应用方面也出现了明显的层次结构。常规的田间监测是文献中的主要焦点,生长监测排在首位,出现在15篇论文中。与之紧密相关的是与产量相关的目标,产量估计出现在13篇论文中,疾病检测出现在11篇论文中,表明人们对直接与生产和风险相关的结果有浓厚的兴趣。紧随其后的一个方法论领域是表型分析,出现在10篇论文中,生理代理指标(如氮估计和叶面积指数(LAI)估计各出现在9篇论文中,反映了将植物状态转化为可操作指标的努力。有8篇论文报告了生物量估计,而土壤属性估计出现在3篇论文中,水分胁迫估计和植物密度估计各出现在2篇论文中。
总体而言,这些计数表明,基于无人机的研究优先考虑操作性的作物状态和以产量为导向的目标,而特定于胁迫和土壤的分析则由较少且更专门的研究子集代表。观察到的应用结构表明,基于无人机的 wheat 研究越来越符合以决策为导向的农学,其中监测系统预计将支持作物诊断、生产力预测和管理导向的解释,而不仅仅是描述性成像。
在各个类别中都出现了两个交叉特征。首先,每个类别都遵循了头部和尾部模式:一小部分广泛采用的项目占据了大部分论文,而许多替代方案仅偶尔出现。例如,在传感器中是多光谱和RGB,在植被指数中是NDVI和RVI,在技术中是随机森林(Random Forest),在应用中是生长和产量。其次,不同类别之间的绝对计数存在差异,顶级技术的计数通常超过顶级应用的计数,这反映了论文倾向于列出多种分析方法,同时集中于一两个主要应用目标。
这些计数反映了使用OCR处理的全文通过模糊匹配和上下文验证获得的论文级别的检测结果。报告风格的差异,如指数使用缩写还是全名,或者应用使用通用术语还是具体表述,可能会影响关键词是否被记录下来,特别是对于相关术语的家族(如经过土壤调整的指数),或者通过同义词引用的技术。尽管如此,在试点测试期间评估的不同阈值设置下,每个类别内的相对排序仍然保持稳定,表明观察到的排名结构对检测敏感性的合理变化具有鲁棒性。
总的来说,这四个类别为后续的关系分析提供了定量基准。更广泛地说,传感器、指数、技术和应用的联合分布表明,基于无人机的 wheat 研究已经朝着一个以多光谱传感、植被指数建模和以决策为导向的农学目标为中心的集成分析生态系统发展。多光谱和RGB传感器以及红边和近红外指数的高普及率支持了下面呈现的共现结构(图5),随机森林(Random Forest)的主导地位有助于在后续分析中理解技术和应用之间的关系。
图5:该图像的替代文本可能是使用AI生成的。
关键词弦图展示了每个类别(传感器、指数、技术和应用)中前10个关键词之间的共现关系
为了研究四个元数据类别(传感器、指数、技术和应用)之间的相互联系,构建了一个共现弦图(图5)。每个类别中的前10个关键词是根据它们的总体频率选出的。计算了所有文档中任意两个关键词之间的共现强度。该图将这些关系表示为连接节点的带状物,较粗的弦表示较高的共现频率。这种可视化提供了关于基于无人机的 wheat 研究中研究元素如何交互的总体概览。
该图表明,多光谱传感器在各个类别之间的连通性最高。它们与植被指数(如NDVI、NDRE和SAVI)有很强的关联,反映了它们在光谱分析和定量冠层评估中的核心作用。相比之下,RGB传感器显示出较弱且更具选择性的关联,主要与VARI和ExG相关,这些指数是从可见光带派生出来的。这种模式表明,RGB图像主要用于结构或基于颜色的分析,并且通常用于低成本或小规模的田间研究。
在指数和技术类别之间,弦图显示了从NDVI和NDRE到监督建模方法的明显链接集中,其中最粗的带状物连接到随机森林(Random Forest),并且与SVM和PLSR有额外的强链接。这种模式表明了无人机衍生数据集的主流工作流程,其中建立的光谱指数与监督模型结合使用,以估计生物物理特征。这些特征通常包括冠层活力、生物量氮状态和与产量相关的参数,这些都是基于无人机的精确小麦监测中的核心目标。相比之下,基于简单回归的技术在指数之间的连接明显较薄,这与主要依赖于监督数据驱动方法的领域一致,而不是纯粹的参数化公式。
从农学角度来看,这些组合反映了在基于无人机的 wheat 监测中常用的实际工作流程。多光谱图像能够提取与冠层结构和叶绿素状态相关的植被指数,而监督机器学习模型则整合了多个光谱预测因子来估计田间条件下的作物特征。因此,在共现网络中突出的传感器-指数-技术配置对应于支持精准农业中诸如产量预测、氮素评估和作物生长监测等应用的操作流程。在实际的田间研究中,这种工作流程通常用于从多光谱无人机图像中提取植被指数预测因子,并在机器学习框架内使用它们来估计产量潜力、氮素状态和田间地块的作物生长变异性。技术与应用之间的联系集中在三种模式中。首先,监督机器学习与生长监测和产量估计之间的联系最为紧密,随机森林形成了最显著的条带,并得到了支持向量机(SVM)的额外支持。表型分析也从中获得了持续但稍弱的联系。其次,以回归为导向的方法,包括线性回归、偏最小二乘回归(PLSR)和支持向量回归,最常与生长监测和生理指标(如氮素和叶面积指数LAI的估计)相关联,这与基于指数的作物状态建模一致。第三,卷积神经网络及相关图像驱动技术为疾病检测和倒伏评估提供了新兴但相对稀疏的联系,表明在这些目标上对像素级分类的采用正在增加但仍然有限。
传感器与应用之间的联系清楚地显示了仪器能力与研究目的之间的对应关系。多光谱传感器显示出最强和最多的联系,特别是在生长监测、产量估计、表型分析和疾病检测方面,这与用于冠层量化的光谱带的广泛覆盖范围一致。高光谱传感器与生化及生理目标(如氮素和LAI的估计)相关联,同时也与疾病检测有关,反映了它们对色素和水分相关特征的敏感性。相比之下,RGB传感器主要与生长监测、产量估计和表型分析对齐,在这些领域中结构和颜色线索以较低的成本提供了有价值的信息。热传感器与水分胁迫估计和疾病检测之间的联系较为薄弱但更明显,这与基于温度的冠层评估一致。激光雷达(LiDAR)的联系较为稀疏,表明在这里考虑的应用集使用有限。
总体而言,共现结构显示基于无人机的小麦研究围绕一个高度互联的传感器、指数和技术框架组织起来,多光谱数据和机器学习模型构成了分析的核心。连接模式突出了当前使用中的主要方法组合以及跨类别整合仍然有限的领域,例如热传感器与先进机器学习方法之间的相对薄弱联系。这些模式为描述基于无人机的小麦研究的现状和确定方法扩展的方向提供了定量基础。从这个角度来看,共现网络不仅可视化了关键词的关联,还揭示了在基于无人机的小麦监测中变得操作上核心的具有农学意义的技术组合。
基于无人机的 wheat 研究的时间评估从2017年到2025年呈现出清晰的发展轨迹(图6-8)。从2017年到2020年,研究数量逐渐增加,随后在2021年到2024年出现急剧且同时的增长,并在2024年达到一个明显的峰值。2025年的下降反映了部分年份的覆盖范围,而不是实质性的收缩。图6显示了特定类别的模式。技术到2024年显示出最快的加速和最高的计数,指数显示出多年的稳步上升,传感器在2024年出现强劲增长,而应用在绝对数量上保持较低水平,在2023年和2024年有小幅度的峰值。
图6
此图像的替代文本可能是使用AI生成的。
2017年至2025年每个领域中最常见的五个关键词(传感器、指数、技术、应用)的年度发表趋势
图7和图8表明,后期生长依赖于多光谱传感与生长监测、LAI估计和产量估计等应用目标的结合,在2023年和2024年这些趋势聚集并加强。总体而言,这些趋势表明从早期试验到2020年代初的方法成熟,到2024年达到了整合活动的最高水平。
图7
此图像的替代文本可能是使用AI生成的。
2017年至2025年每年传感器与应用组合的热图
图8
此图像的替代文本可能是使用AI生成的。
总结传感器-应用对时间分布的年份和关键词聚类图
传感器相关的时间序列显示了技术采用的层次化模式。自2020年以来,多光谱传感已成为主导平台,其计数急剧增加并在2024年达到明显峰值。这一扩展与轻量级多光谱相机的广泛可用性相一致,这些相机提供了适合植被指数计算的稳定光谱信息。多光谱系统的普及突显了它们作为基于无人机的小麦研究定量分析基础的作用。这些模式的时间趋同表明,以小麦为导向的无人机研究已经从探索性传感器测试转向了传感、建模和应用特定流程的协调使用。
相比之下,RGB传感在早期(2017年至2019年)最为明显,从2019年到2021年有短暂的增长,然后逐渐减少。这种转变反映了从主要基于视觉或颜色的监测向基于反射率评估的转变,这是由多光谱数据实现的。尽管如此,RGB图像在成本敏感或小规模监测中仍然是一个稳定的存在,其中可见光波段指数(如VARI和ExG)提供了足够的表型或结构线索。热传感器、高光谱和激光雷达的出现频率较低,但显示出明显的局部峰值,这与目标用途(如冠层温度映射、生化特征检测和结构特征描述)一致。
综合来看,这些模式表明多光谱传感器构成了分析的支柱,而其他传感器在特定情境下提供了互补的生理或几何信息。指数和技术类别显示出紧密耦合的增长,表明最近无人机研究中方法论的复杂性不断提高。植被指数(如NDVI、NDRE和SAVI)在2021年后同步增加,从2023年到2024年显著增加,再次确认了它们作为冠层生理和活力的核心表示的作用。
在同一时期,技术类别转向了监督数据驱动的分析。随机森林、SVM和PLSR成为主导工具,而简单的回归模型出现频率较低,通常用于基线或比较角色。NDVI和NDRE与这些学习器的频繁共现反映了植被指数在高级模型中作为预测因子的固定工作流程。这些指数和方法的趋势共同说明了基于无人机的农学研究的日益整合和成熟。
在应用类别中,焦点和范围的明显转变显而易见。早期研究集中在形态目标的结构上,经常使用RGB或其他低成本图像。从2021年开始,范围扩大到包括产量估计、氮素和LAI评估以及疾病检测。这些主题标志着从描述性观察向预测性和诊断性建模的转变,旨在支持小麦生产的精确管理。与应用相关的关键词从2022年到2024年显著增加,2024年显示出最大的多样性和所有类别中的最高活动水平。与多光谱传感和监督建模的并行增长一起,这一轨迹表明基于无人机的 wheat 研究已经从基本的图像采集发展到更综合的农学解释。这种转变还表明,基于无人机的遥感不仅用于描述性作物观察,还用于小麦管理中的定量决策支持应用,如产量预测、营养评估和胁迫检测。
传感器与应用的热图(图7)显示了仪器能力与研究目标的对齐方式。最密集的带位于多光谱行上,其中联系集中在LAI、生长状态、氮素和产量估计上。这种模式与多光谱系统作为主要分析平台一致;光谱覆盖范围足够广泛,适用于指数计算,而田间操作仍然高效可靠。在这些配对中,来自多光谱数据的指数作为生理和产量相关特征的定量预测因子。
RGB传感器形成了一个独特但较弱的集群,侧重于结构评估。它们最常与生长跟踪、生物量量化和植株密度指标一起出现,强调了颜色和纹理线索对于成本敏感或小规模监测的价值。热传感主要与水分胁迫诊断对齐,在其中冠层温度提供了直接信号。高光谱仪器连接氮素和其他生化目标,反映了人们对植物生理的精细光谱诊断的兴趣。激光雷达的联系较为稀疏,侧重于结构映射和冠层密度,表明其作用补充了光谱模式。总体而言,热图勾勒出一个分层的生态系统:多光谱图像构成了主导的分析工作流程,RGB支持基于视觉的结构评估,而热和光谱扩展了覆盖范围到生理和生化领域。
为了检查组合随时间的变化,年份和关键词聚类图(图8)显示了传感器与应用对的时间分布及其层次化分组。观察到三个时间阶段:在初始阶段(2017年至2019年),大多数活动集中在RGB与生物量估计和表型分析上,反映了使用易于获取和部署的视觉指标来表征作物状态的早期努力。2020年至2022年的扩展阶段标志着向定量光谱分析的转变。多光谱传感与生长监测和氮素估计的结合变得越来越突出,RGB与产量估计的结合开始出现在文献中。2023年和2024年的成熟阶段显示出最高的活动集中度,由多光谱与LAI估计、生物量估计和产量估计相结合引领。多光谱与疾病检测以及高光谱与氮素估计的结合也出现了,表明向胁迫生理和生化特征分析的多样化发展。到2025年,计数似乎有所下降,这可归因于部分年份的覆盖范围,而不是研究活动的实际减少。
图8中的层次结构强化了这一解释,顶部是密集的多光谱和定量集群(LAI、生长、氮素和产量估计),中间是中等规模的RGB和结构集群(生物量、表型分析和冠层监测),底部是稀疏但新兴的热或高光谱集群(胁迫和生化分析)。这种组织与图6中显示的分布模式一致,表明基于无人机的 wheat 研究从基于视觉的监测系统向基于光谱的分析框架的系统转变。
总体而言,图6-8中的时间模式表明基于无人机的 wheat 研究经历了连贯的渐进式发展。2017年至2020年的早期阶段对应于采用和探索,以基于RGB的观察和简单的经验建模为主。2021年至2022年的中期阶段显示出方法论的多样化,多光谱传感变得更加突出,监督学习开始常规使用。最近的2023年和2024年阶段标志着整合,多光谱传感器和先进分析技术(特别是随机森林、SVM和偏最小二乘回归)得到广泛应用,用于冠层特征和产量相关参数的定量估计,2024年的计数达到峰值。2025年的下降反映了部分年份的覆盖范围,而不是研究活动的实际减少。
热图和年份-关键词聚类的结果强化了这一解释。多光谱图像构成了主导的工作流程,而热、高光谱和激光雷达扩展了覆盖范围到水分胁迫、生化特征和结构映射,表明逐渐向多传感器融合和更复杂的生理推断发展。总体而言,传感器、指数和技术领域的同步增长表明该领域正在系统地、数据驱动地成熟,基于无人机的遥感不仅作为观察工具,还作为精确小麦管理的综合分析框架。这些时间变化不仅反映了并行但孤立的进步,还表明该领域已将传感技术与农学目标和预测分析日益整合到连贯的精确监测工作流程中。
基于方法论元数据的无人机 wheat 研究聚类显示了四个不同的方法论分组。这些集群也可以解释为文献中观察到的代表性基于无人机的分析工作流程。每个集群反映了特定的传感技术、植被指数和建模技术的组合,这些组合对应于基于无人机的作物监测中的具体操作策略。因此,这些集群不仅总结了方法论模式,还展示了实际小麦研究中不同无人机数据处理流程的配置方式。集群使用PCA(图9)进行分离,它们的年度流行度显示在图10中,而图11中的词云总结了定义性术语。第1簇的特点是专注于土壤的目标和经典建模,关键词包括土壤属性估计、ECI、BNDVI、GNDVI、MCARI1、贝叶斯优化、多元回归,偶尔使用LiDAR。第2簇以RGB为中心,注重应用,结合可见光波段指数和监督学习器来处理田间级别的目标;主要术语包括RGB、随机森林(Random Forest)、支持向量机(SVM)、ExG、SR、表型分析(phenotyping)、疾病检测(disease detection)和热成像(thermal)。第3簇是高光谱和指数驱动的,将NDVI、RVI及相关指数与随机森林以及线性或PLSR风格的建模相结合,用于生理特征分析。第4簇代表了新兴的深度学习和高级指数空间,术语包括变换器(transformer)、图神经网络(GNN)、MCARI2、ExGR、GOSAVI、GCVI和LiDAR,表明了更丰富的表示能力和融合就绪的工作流程。
图9:该图像的替代文本可能是使用AI生成的。
全尺寸图像
主成分分析(PCA)可视化展示了聚类的无人机小麦研究
图10:该图像的替代文本可能是使用AI生成的。
全尺寸图像
从2017年到2025年每个簇的年增长率,以堆叠条形图显示
图11:该图像的替代文本可能是使用AI生成的。
全尺寸图像
从OCR处理的语料库中提取的每个簇中最常出现的关键词的词云
所有簇在2020年后都有所增长,其中2023年和2024年的增长最快。第4簇的增长最为显著;第1簇也有显著增长,第3簇表现出中等但稳定的增长,而第2簇的增长幅度较小。结合图10中的特征,这种模式表明研究从可见光谱监测发展到多光谱量化和高光谱生理建模,同时最近转向基于深度学习和融合的方法。
这种研究模式的观察表明,聚类不仅捕捉了论文之间的主题相似性,还捕捉了实际无人机工作流程的阶段性演变,从易于访问的视觉监测发展到信息丰富且计算密集的农艺流程。
第1簇:多光谱定量流程作为精准表型分析的基础
第1簇涵盖了基于无人机的 wheat 研究的定量核心。该组的研究依赖于具有近红外和红边波段的多光谱成像系统(例如MicaSense RedEdge、Parrot Sequoia或Altum),以推导出描述冠层生理的植被指数,包括叶面积指数(LAI)、氮状态和地上生物量。然后使用NDVI、NDRE、SAVI和GNDVI等指数作为监督回归框架中的预测因子,最常用的是随机森林(Random Forest)、PLSR和支持向量机(SVM),并特别注意辐射校准和光谱校正。
一项代表性研究展示了该簇的特征。Silva等人(2024年)为热带小麦育种试验开发了一个多光谱表型分析工作流程,每周飞行420个基因型及相关指数,特别是NDVI和NDRE,以预测最终产量。线性混合效应建模和随机森林(Random Forest)确定NDRE是跨氮水平的稳定产量预测因子,而指数的时间整合提高了在压力条件下的基因型区分能力。
Ding等人(2023年)将无人机多光谱时间序列与基因组关联分析相结合,从NDVI和NDRE轨迹建模氮响应动态,并将其与全基因组关联结果联系起来,体现了成熟的“表型组学”(phenomics),将冠层信号与氮利用效率基因联系起来。Yu等人(2024年)使用四个光谱指数(NDVI、GNDVI、NDRE和OSAVI)分析了两个季节的叶片保持绿色(stay-green)情况,得出了相对叶片保持绿色分数,并将定量性状位点与全基因组关联研究进行了映射,报告了许多高置信度的位点和数千个相关的单核苷酸多态性(single-nucleotide polymorphisms),从而将高分辨率遥感与分子育种联系起来。
总体而言,第1簇代表了基于无人机的 wheat 研究中一个成熟且可复制的流程,结合了时间丰富的多光谱感测、标准化的校准和校正以及强大的回归模型,将光谱指数转化为农艺性状,用于精准表型分析。
第2簇:基于RGB的结构和形态监测
第2簇以RGB图像和可见光波段植被指数为中心,使用低成本相机、简单的成像几何结构和经典图像分析来量化冠层颜色、密度和形态。研究通常使用VARI、ExG、RGBVI和MGRVI来支持生物量估计、表型分析和基于生长阶段的监测,这些方法在操作上具有可扩展性。
Xie等人(2024年)研究了Hetao灌溉区不同施肥条件下的春小麦,并报告了RGB衍生指数(如GLA、GRRI、ExG和RGBVI)与生理变量(包括叶绿素和水分含量)之间的强相关性,其中开花阶段提供了关于生长潜力的最丰富信息。Li等人(2023年)将无人机RGB数据与田间表型分析相结合,跟踪叶片保持绿色的动态,从时间颜色变化量化衰老率,将这些指标与基因型的产量稳定性联系起来,并将定量性状位点与叶绿素保留和冠层温度相关联,表明基于RGB的表型组学可以超越简单的颜色描述。
总之,第2簇位于方法论谱系的易访问端,能够在育种计划和田间试验中快速部署和广泛覆盖,同时对于捕捉形态异质性和冠层时间动态仍然很有价值,尽管缺乏红外信息。
第3簇:高光谱和生理诊断
高光谱感测将注意力从结构描述转移到生理和生化推断上。记录数百个窄波段的仪器能够以精细的光谱尺度估计叶绿素、氮和色素含量。典型的工作流程结合了基于物理的辐射传输模型(如PROSAIL)、多LUT反演和化学计量回归方法(包括PLSR和多元线性回归)。重点是将冠层反射率与生理状态联系起来,而不仅仅是依赖宽带指数。
这一方向的证据来自早期和最近的研究。Li等人(2019年)引入了一种基于N PROSAIL模型的多LUT反演,用于估计冬季小麦的冠层氮密度。他们使用无人机高光谱图像以及Sentinel-2多光谱数据和ASD仪器的地面光谱,报告了无人机高光谱源的最高准确性,R2值为0.69,证明了当物理建模与经验校正结合时可以在田间级别检索生化性状。Feng等人(2022年)比较了无人机RGB和高光谱数据,用于综合生长指数,该指数整合了生物量、氮、叶绿素和水分含量。为这两种传感器类型构建的回归模型,包括多元线性回归(multiple linear regression)、PLSR和支持向量机(PLSR)和随机森林(Random Forest),显示高光谱图像具有明显优势,因为它受益于更精细的光谱分辨率和减少了背景反射的干扰。
综合考虑,第3簇将基于无人机的 wheat 研究推向了非破坏性的生化诊断。高分辨率光谱结合辐射传输建模和数据驱动的回归,可以在地块和田间尺度上检索与光合作用、氮代谢和色素组成相关的性状,支持对作物生长模型的机制理解和参数化。
第4簇:融合、热成像和深度学习整合
第4簇处于方法论创新的前沿,其中多传感器融合和深度学习整合了RGB、多光谱、热LiDAR和气象输入,以解决复杂的农艺目标。典型目标包括胁迫检测、生长阶段识别、疾病分类和多环境产量预测,模型旨在学习跨模态的互补信号,而不是依赖单一数据源。
代表性研究展示了多种方法。Das等人(2021年)将无人机热成像与多光谱植被指数相结合,并训练了分类和回归树模型,在钠盐土壤胁迫下预测产量时R2值超过0.75;热指标如作物水分胁迫指数(crop water stress index)和冠层温度提高了对水分状态和胁迫条件的敏感性。Bao等人(2023年)提出了一个基于注意力网络(ASFFNet)的算法,用于从无人机RGB图像中检测小麦枯萎病,与YOLOv3和YOLOv4基线相比,平均精度提高了约4-6%,表明空间注意力和特征融合有助于恢复精细尺度的病理线索。
Shen等人(2024年)引入了GSP AI,这是一个多模态框架,将无人机图像与气象数据融合,用于识别小麦生长阶段并预测开花转变;Res2Net和长/短期记忆架构在阶段分类上的准确率达到93.4%,在开花时间上的均方根误差为4.7天,训练数据来自中国、英国和美国的大量标注图像。
总体而言,第4簇标志着从被动观察向预测性农学的转变。通过融合热成像、光谱、结构和气候数据与深度学习,这些研究将基于无人机的分析扩展到了物候预测和胁迫诊断,使无人机系统成为精准小麦管理的预测平台,而不仅仅是独立的成像工具。
综上所述,这些簇展示了基于无人机的 wheat 研究如何发展出多种方法论流程,从基于RGB的视觉监测发展到多光谱定量建模和新兴的深度学习驱动技术。
讨论
在过去十年中,基于无人机的 wheat 研究在遥感在农学中的概念和使用方面展现出了累积性的演变,而不是断续的。探索性的RGB导向试验已经成熟为一个结构化的方法论生态系统,能够进行定量预测、生理解释和决策支持。本研究综合了这一轨迹,并将其作为文献信息支持的参考路径,适用于研究活动仍然有限的地区。
该领域的重心现在位于多光谱定量流程上:校准的多光谱图像;植被指数如NDVI、NDRE和SAVI;以及用于产量、氮状态和冠层结构的监督学习。RGB工作流程仍然作为培训和推广的入门模式具有价值,而高光谱和多模态融合与深度学习代表了具有战略性的长期能力。传感器(Sensor)、指数(Index)、技术(Technique)和应用(Application)领域之间的共现模式证实了这一核心,而热成像(thermal)、LiDAR和深度学习之间的相对较弱联系表明了有前景但尚未充分发展的方向。
一个实用的分阶段采用模型直接源自这些模式。第一阶段涉及熟悉易于访问的RGB监测和基本分析。第二阶段将多光谱和监督回归标准化为默认的操作堆栈,包括指数校准、交叉验证的建模和可解释的输出。第三阶段在数据量、校准程序和人力能力到位后,扩展到了融合和AI支持的框架。这种分层技术使方法论目标与机构准备情况相一致,并支持在低活动设置中的可扩展的低风险激活。
这项分析还展示了元数据驱动综合的价值。通过将大规模文献转换为连接传感器、指数、技术和应用领域的结构化信号,OCR/NLP流程可以指导项目设计和资金流向具有最强实证基础的工作流程,而不是基于临时技术选择。与传统的文献计量分析不同,后者主要关注出版物数量、引用网络或作者级别的元数据,这里的方法直接从研究文章的全文中提取方法论信息。这使得能够识别感测技术、植被指数、分析技术和应用目标之间的关系,这些都在个别研究的方法论描述中嵌入。因此,当前框架通过构建基于无人机的 wheat 研究的方法论景观,为文献计量研究提供了补充视角,而不仅仅是分析出版物或引用模式。
除了识别一般的研究趋势外,本研究确定的结构化关系还对基于无人机的 wheat 监测的研究规划和技术选择具有实际意义。例如,多光谱传感器、NDVI衍生指数和随机森林等机器学习技术的频繁共现反映了常用的作物状况评估和产量相关建模的分析工作流程。这些模式可以帮助研究人员和从业者优先选择在文献中显示出实证效用的感测技术和分析流程。通过这种方式,这里提出的元数据驱动的综合有助于在基于无人机的农艺研究设计中进行更基于证据的决策。
这些发现还强调了基于无人机的元数据趋势在精准农业应用中的实际相关性。多光谱传感器、NDVI和NDRE等植被指数以及随机森林等机器学习技术的频繁关联反映了常用的作物状况评估和产量相关建模的分析框架。同样,几个簇中观察到的高光谱和热成像组合表明了疾病检测和胁迫诊断的新兴机会。
通过识别文献中最常采用的传感器-指数-技术配置,本研究为设计基于无人机的监测系统提供了有用的指导,这些系统旨在实现关键的精准农业任务,包括产量估计、氮管理和作物健康评估。
优势与局限性
结果在记录级别报告,这保持了可审计性,但当多个记录代表同一研究时可能会夸大计数。在这个语料库中,一个预印本-期刊对(ID 53-79)和一个标题-变体对(ID 72-80)被有意保留为不同的记录(补充表S3)。这种选择不会改变主要模式的定性排名,尽管它可能会略微影响年度统计。
有效性的其他威胁包括OCR噪声、指数和技术的别名和缩写的歧义,以及出版物来源偏向于资源丰富的地区或平台。本研究使用的文献语料库是通过在欧洲公共医学图书馆(Europe PMC)中执行针对性查询获得的,该查询旨在确保与基于无人机的小麦田研究具有高度的相关性。尽管使用多个文献数据库进行更广泛的搜索策略并扩展与无人机相关的术语可能会增加检索到的记录数量,但当前的方法更注重检索的准确性,以减少无关文档的数量,并确保基于光学字符识别(OCR)的元数据提取的可靠性。未来的研究可以通过多数据库搜索来扩展语料库,从而进一步增加基于无人机的农学文献的覆盖范围。这些措施通过别名规范化、零样本上下文验证和透明清单(表S2–S3)得到了缓解,但仍然对解释和未来的复制工作具有重要意义。
尽管OCR处理可能会引入识别错误,尤其是在处理缩写或方法术语的变体时,但手动验证结果(表3)表明,自动化流程能够可靠地检测出研究文章中的主要方法元数据类别。虽然在植被指数或分析技术的具体列举上仍存在差异,但OCR-NLP工作流程提供了足够稳健的信号,以支持对文献中方法模式的大规模综合分析。尽管存在这些限制,但仍采取了几项保障措施来提高元数据提取过程的可靠性。在开发流程过程中,手动检查了OCR输出,以识别常见的识别错误,并引入了别名规范化规则,以减少植被指数和技术名称的歧义。此外,还应用了基于零样本自然语言推理的上下文验证,以减少由于缩写重叠或术语模糊导致的错误分类。这些措施有助于减轻OCR噪声、NLP歧义和数据库覆盖偏差的潜在影响,同时保持自动化标记框架的透明度。
此外,语料库早期相对较少的研究数量可能会限制对长期趋势解释的可靠性。这种模式可能反映了2010年代末无人机平台在小麦田实验中的逐步采用,而不是系统性的抽样限制。有几个值得注意的优先事项,包括标准化多光谱研究的校准和报告,包括面板、目标和照明日志;构建将植被指数时间序列与协调一致的地面真实值配对的基准数据集;推进可解释的机器学习,以将准确性与农学可解释性联系起来;以及定义明确的融合协议,明确指出何时热成像、激光雷达或高光谱层能够比多光谱核心提供可测量的优势。
未来对该框架的扩展可以纳入动态趋势分析,以识别基于无人机的小麦监测中的新兴技术。例如,可以使用简单的生长率指标或关键词频率轨迹来检测快速发展的方法主题,如深度学习架构或多模态传感器融合的采用。这样的分析可以进一步增强元数据驱动框架预测技术变革的能力,并指导未来的研究方向。除了目前的贡献之外,本研究开发的框架还有潜力发展成为一个实用的研究支持工具。通过将基于OCR的文本提取与NLP驱动的元数据标记集成,该流程可以扩展为一个开源平台或交互式应用程序,使研究人员能够上传文献集合,并自动获取结构化的方法元数据和可视化输出。这样的系统可以支持大规模的文献综合,并促进基于无人机的农业研究中更透明和可复制的知识发现。
总之,基于无人机的 wheat 研究最好被理解为一系列可扩展的方法,而不是孤立的技术。从多光谱标准化开始,逐步扩展的战略定位,为新兴项目提供了建立能力、提供决策支持以及为精准农业和气候适应性作物管理做出贡献的现实路径。
**结论**
这项元分析表明,基于无人机的 wheat 研究已经从碎片化的特定传感器实验发展成为一个综合的方法框架,涵盖了多光谱量化、高光谱诊断和基于人工智能的多模态融合。元数据的系统提取和分析阐明了这一演变的结构逻辑,表明连续的方法层次如何促进了精准农学的更广泛生态系统的发展。这些全球模式被重新构建为实际参考,适用于那些基于无人机的研究和田间示范仍处于形成阶段的地区,将当前的能力与未来整合的分阶段路径联系起来。这些发现表明,基于无人机的农学科学的进步遵循的是累积轨迹,而不是突然的转变。早期的基于RGB的监测提供了可访问性和熟悉度,多光谱工作流程引入了定量准确性和可重复性,而最近的融合和基于人工智能的框架则实现了预测智能。这一轨迹为活动有限的地区指明了明确的操作路径。从可访问的工具开始,逐步发展分析能力,并朝着集成和自动化方向扩展。来自聚类和时间分析的证据支持了一种分阶段策略,优先考虑短期内多光谱和机器学习工作流程的标准化,并随着机构专业知识的成熟,追求对高光谱感知和多模态融合的长期投资。
除了其方法论贡献之外,这项研究还展示了如何利用元数据驱动的分析来指导农业创新政策。将科学出版物转化为结构化证据,使得能够评估全球研究的成熟度,并将本地投资与经过验证的、可扩展的方法论对齐。在这个意义上,所提出的框架超越了无人机或小麦本身,为设计数据驱动的、特定于情境的农业研究策略提供了可转移的参考。最终,愿景是未来基于无人机的遥感技术可能从一个孤立的趋势发展成为一个更加适应性和数据驱动的系统,用于可持续的作物管理。通过在基于全球验证的框架上进行构建,同时立足于本地能力,活动有限的地区可以加速向数据驱动农业的转变。然而,这种转变并不是从引入先进技术开始的。它始于对可访问的、标准化的、可解释的工作流程的结构化采用,这一步骤弥合了创新与实施之间的差距,将遥感从潜在技术转变为实际应用。
打赏