发展中国家正试图利用技术创新来更清楚地了解农民面临的问题(Li等人,2024年)。农业行业也受到许多问题的影响,例如天气模式的不可预测性、设施不足以及病虫害的侵袭(Srikanth等人,2024年),这些问题往往导致农民的农业生产不佳(Hong等人,2024年)。缺乏及时的数据阻碍了该行业的发展,而数据不足的问题进一步加剧了这些问题(Choudhury等人,2024年)。为了解决这些问题,印度政府建立了Kisan Call Centers(KCCs),为农民提供及时的信息和建议(Sun等人,2024年;Kowalczyk等人,2024年)。印度农业部创建了农业咨询和信息中心,以帮助农民获取农业咨询和服务信息(Manoj等人,2023年)。每天有数百万农民通过这些中心咨询各种农业相关问题(Alotaibi等人,2023年)。
KCCs是农民获取信息的重要来源,为他们提供市场价格、政府项目、病虫害控制以及作物种植等方面的数据(Roy等人,2024年)。尽管KCCs在向农民提供数据方面取得了成功,但呼叫中心工作人员的知识水平和可用性被认为是解决查询问题的关键因素(Whairit等人,2023年)。这可能导致响应的一致性不足和响应延迟(Ma,2024年)。此外,大多数问题都转交给KCCs处理,而呼叫中心工作人员可能难以应对如此大量的问题。通过使用自然语言处理(NLP)方法,自动化问答系统可以快速准确地回答农民的需求(Quan,2024年)。KCCs拥有大量的通话记录,这些记录可以用于开发问答机制(Srikanth等人,ICAAAI-2023(2024))。还有其他方法提出利用KCC数据集来训练计算机系统,以便其能够回答农民提出的问题(Alam等人,2023年)。
然而,很少有解决方案能够利用人工智能相关技术来解决这个问题(Mang等人,2024年)。此外,现有的系统使用传统的词袋模型(BoW)和词频-逆文档频率(TF-IDF)等方法计算短语向量之间的余弦相似度时,未能考虑句子的语义(Wang等人,2023年)。随着更多社交媒体平台的合并,人们创造了多种方法利用Facebook和Twitter等平台收集农业信息,以应对农业挑战(Ochoa等人,2024年)。深度学习(DL)彻底改变了NLP领域,其在农业中的应用非常有益(An等人,2023年)。DL技术能够识别农业术语的细节,包括当地语言和专业术语,并利用变化情况,从而实现更好的查询解释(Gedel和Nwulu,2024年)。DL模型可以通过考虑查询的上下文(如地面上种植的作物、地理位置和环境条件)来提供准确和有用的响应(Li等人,2023年)。
本研究的目的是探讨全球人口增长对食品和农产品需求的影响。鉴于农业在经济发展中的重要性,报告指出需要基于现代技术的系统,以帮助农民最大限度地利用资源。通信技术的进步,如移动接收器,增强了与农民沟通的能力以及支持服务和呼叫中心的建立。特别是,本研究旨在改进KCC项目,以适应该国庞大的农业人口,并开发基于文本的问答系统和农业响应机制,为农民提供及时可靠的支持,从而改善他们的生活和财务状况。研究强调了开发综合资源库和相关问答框架的重要性,以便在全国范围内回答有关植物保护的问题。通过公开提供信息库和算法,鼓励重复使用,并强调使用公开数据。研究的主要目标是利用技术改善农业援助和数据交换,从而惠及农民并促进农业产业的发展。研究的主要成果如下:
•学习丰富的语义特征,以准确理解农民的查询。
•实现高效地检索与农民输入相关的农业响应。
•表现出优于其他技术的性能。
•在大规模农业问答生成中实现了98.04%的准确率。
•在3400万个真实农民查询中提供了97.98%的F1分数的精确答案。
•将响应时间缩短至3.16秒,实现近乎实时的农民决策支持。
本文的其余部分分为几个部分。第2节介绍了关于农业问答系统的先前研究。第3节使用背景数据讨论了研究的理论基础,并定义了推荐的架构。第4节展示了研究结果和实验结果,并将发现与近期研究进行了比较。第5节给出了结论和未来的研究方向。