一种基于混合深度学习的框架,通过整合生物物理参数和光学遥感数据来预测印度的水稻产量

时间:2026年2月3日
来源:Journal of Atmospheric and Solar-Terrestrial Physics

编辑推荐:

水稻产量预测研究提出MLR-LSTM混合模型,集成线性回归与长短期记忆网络,利用1998-2023年四个地区数据预测至2029年。模型通过主动学习减少标注数据需求,显著提升准确率(R²=0.9823)及精度指标(MAE=0.021),有效整合遥感与地面生物物理参数,为农业决策提供支持。

广告
   X   

Rafath Samrin | Pundru Chandra Shaker Reddy | K. Arun Kumar | Natha Deepthi | C. Mithra | S Bhargavi Latha | Sucharitha Yadala | Gopal Kumar Thakur
计算机科学系,计算机科学学院,King Khalid 大学,Asir-Abha 61421,沙特阿拉伯

摘要

印度是全球水稻种植的主要国家。水稻产量的预测是一个亟待解决的问题。准确且及时的产量预测能够为农作物生产带来显著效益。时间序列模型被广泛用于水稻产量预测,但其准确性仍有待提高。尽管这些模型应用广泛,但往往无法达到所需的精确度。本研究采用了一种实用的机器学习(ML)方法来预测未来五年的水稻产量,并将其性能与最先进的模型进行了比较。该研究利用混合框架(结合了多元线性回归(MLR)和长短期记忆网络(LSTM))进行预测,预测范围从当前年份延续至2029年。预测数据来源于西孟加拉邦和北方邦的四个地区,时间跨度为1998年至2023年。研究的重要发现是:可以提前五年预测水稻收获情况,为农业决策和规划提供有用信息。由于本研究揭示了将遥感技术与生物物理参数结合使用的可能性,研究人员、政策制定者和农民都能从中受益。用于评估模型的指标包括R²、RMSE、MAE、MSE、准确率(Acc)、F1分数(F1)、召回率(Re)和精确度(Pe)等。实验结果表明,所提出的方法在准确率、R²、RMSE、MAE和MSE方面分别达到了0.9823、0.956、0.1436、0.021和0.198。

引言

从全球范围来看,印度是仅次于中国的第二大稻米生产国。印度生产的稻米占全球总量的20%,这表明水稻在印度具有极其重要的地位(Bharadiya等人,2023年)。全年种植的水稻中,70%是在水稻生长季节种植的。基于机器学习的人工智能作物预测程序可以帮助农民根据土壤养分和环境因素选择合适的作物。基于AI的作物预测模型将有助于提高农业产量和国家经济(Wang等人,2024a)。一种名为“粒子群优化-改进型深度神经网络”的深度学习方法已被提出,并在作物推荐方面表现出有效性,现已扩展应用于水稻产量预测(Wang等人,2024b)。多参数深度神经网络在不同类型的作物预测中显著提升了统计效率(Ishaq等人,2023年)。印度的主要目标是满足全球对水稻的需求,为此,可持续发展目标(SDGs,作为千年发展目标MDGs的继任者)将在2030年前成为重点。可以看出,水稻是全球主要农作物之一,预测其产量对于保障全球粮食安全至关重要(Das等人,2023a)。本研究利用1998年至2022年的数据,通过Facebook Prophet算法预测未来五年的水稻产量。这种监测方式有助于提高农场生产力和运营效率。近年来,许多技术得到了应用,其中就包括基于遥感的技术和各种建模工具(Grubert,2023年)。其他模型也可以根据作物的生理特征进行产量预测。
过去,使用机器学习方法预测作物产量是一种常见做法。但这些方法仍需要大量数据和专业知识来实施,并且无法完全考虑生物和非生物因素的变化。传统的产量预测方法由于依赖地面采集的数据和历史数据,常常出现误差或延迟。然而,随着卫星搭载的光学和合成孔径雷达(SAR)传感器的发展,遥感技术彻底改变了我们追踪和预测水稻收获的能力(Kganyago等人,2024年)。利用光学遥感指数进行作物产量预测已成为多项研究的主题。最近有研究探讨了使用SAR数据预测小麦、珍珠粟、大豆和水稻等作物产量的可能性。结合光学和SAR遥感数据可以全面了解稻田情况。SAR传感器能够穿透云层,提供土壤湿度、表面粗糙度和作物结构等详细信息,而光学传感器则能记录植被健康状况、冠层结构和光谱特征(Dlamini等人,2023年)。
机器学习的最新发展提高了产量预测的效率和精确度,使其能够更有效地处理来自各种来源的大量数据和复杂交互信息。为了准确预测不同生长阶段和生态条件下的作物产量,需要将地面生物物理因素(如LAI、生物量和植物含水量)与遥感数据相结合。这有助于开发既准确又及时的监测系统。许多研究人员利用机器学习算法预测了苹果、小麦、大豆、土豆、杏仁、玉米和甘蔗等作物的产量(Darra等人,2023年)。此外,还有研究使用RSD或其他补充/历史数据作为输入来预测水稻产量。科学家们结合光学和SAR遥感指数进行水稻产量预测,结果显示多传感器结合使用可提升模型性能。这是因为光学数据中的云层干扰问题可以通过SAR数据得到缓解(Kheir等人,2024年)。然而,目前尚未有研究结合光学数据、SAR数据和地面测量的作物生物物理参数来预测水稻产量。因此,本研究旨在利用机器学习方法和生物物理、遥感因素来预测三个生长阶段的水稻产量。这种方法通过加深对作物生长与遥感数据之间复杂关系的理解,提高了产量预测的准确性(Das等人,2023b)。
现有研究存在以下不足:传统的MLR和LSTM模型准确性不足,时间预测范围有限(通常为一到两年),且统计回归与深度学习的结合不够充分,难以实现长期预测。我们提出的混合框架结合了MLR和LSTM,以发挥两种模型的优势,提高预测精度,并实现长达五年的可靠预测,这是以往研究未能有效解决的难题。
时间序列预测有多种技术,其中多种机器学习技术可用于准确预测作物产量。因此,在开发预测应用时,机器学习策略是一种具有较少限制的常用方法。机器学习技术在作物产量预测中具有数据驱动、非参数化、非线性和自适应等优点(Croci等人,2022年)。印度全国范围内种植水稻及其他作物,使其成为最重要的粮食作物。及时准确地预测全年及生长季节的水稻产量对于实现最大产量至关重要。为此采用了MLR-LSTM方法。该方法的优势在于能够自主识别趋势变化。影响作物产量的因素及其年际变化也需要考虑。预测过程中需考虑三个关键因素:趋势、季节性和节假日。
本研究的主要贡献包括:
  • 帮助农民和决策者应对气候变化和未来粮食安全问题,该决策支持工具考虑了当地天气模式。
  • 提出了一种利用先进机器学习预测农业产量的策略。
  • 通过引入主动学习机制,可以减少训练所需标记数据的量,从而提高模型性能。
  • 混合模型通过迭代更新模型并选择最具信息量的样本进行标记,提高了预测精度并降低了标记成本。主动学习使模型能够适应天气变化或病虫害爆发等现场条件。
  • 该模型在标记样本较少的情况下仍能保持高精度,适用于精准农业。
    • 通过将主动学习融入预测方法,可以提升全球、区域和地方的决策能力。本文结构如下:第2节回顾现有学术文献;第3节介绍所用技术;第4节展示实验结果;第5节总结结论并提出未来研究方向。
      相关工作
      研究人员正在利用现有数据开发可靠的产量估算方法。正如Wang等人(2024c)所指出的,输入数据质量、模型设计以及数据集中的输入变量与目标变量之间的关系会影响机器学习算法的预测准确性。农业研究人员正在探索通过结合天气数据和农业数据来改进产量预测的方法。
      方法论
      本节详细描述了数据收集与处理方法、提出的模型架构及步骤。提出的模型概念图见图2。
      结果与讨论
      本研究的核心是软件模型的预测功能。通过多种实验确定了最合适的算法,以帮助分析和预测水稻生长情况。根据表1中的性能指标评估了混合模型的预测效果。图5和图6展示了模型性能。
      结论与未来工作
      为了提高农业生产的预测效率,我们评估了所提出的混合模型与深度学习方法(如RF、SVM和LSTM)的性能。通过比较不同模型的性能指标得出了结论。
      CRediT作者贡献声明
      Rafath Samrin:撰写、审稿与编辑、调查。 Pundru Chandra Shaker Reddy:撰写初稿、方法论设计、数据整理。 K. Arun Kumar:验证、数据分析。 Natha Deepthi:数据可视化、验证。 C. Mithra:数据可视化、指导。 S Bhargavi Latha:方法论设计、数据分析。 Yadala Sucharitha:撰写初稿、项目管理。 Gopal Kumar Thakur:方法论设计、调查。
      利益冲突声明
      作者声明没有已知的可能影响本文研究的财务利益或个人关系。
      致谢
      作者感谢King Khalid 大学的研究与研究生院通过小型研究项目(项目编号:RGP1/172/46)资助了本研究。

      生物通微信公众号
      微信
      新浪微博


      生物通 版权所有