基于多模态传感与机器学习的萝卜地上-地下性状关联预测模型研究

时间:2025年9月15日
来源:Smart Agricultural Technology

编辑推荐:

本研究针对根茎类作物地下性状难以无损监测的问题,通过融合iPad LiDAR获取的作物表型数据与多传感器环境数据,构建了基于随机森林(RF)的萝卜株高日预测模型和收获期产量预测模型。结果表明:株高预测相关系数(COR)达0.94以上;融入根裂信息的产量预测模型COR提升至0.85(未融入模型仅0.47)。研究证实了通过地上部信息和环境数据预测地下性状的可行性,为根茎类作物精准监测提供了新范式。

广告
   X   

在精准农业快速发展的大背景下,作物生长模型的构建一直是农业信息化领域的核心挑战。尤其对于萝卜等根茎类作物,其地下部分的生长状况难以直接观测,传统依赖破坏性取样的监测方式效率低下且缺乏时效性。虽然遥感技术和传感器网络的发展使得作物地上部表型信息获取能力大幅提升,但如何通过地上部性状与环境因子来预测地下产量形成,仍是亟待突破的科学难题。

以往研究多基于过程模型描述作物生长规律,但模型需要复杂的参数校准且对环境动态响应能力有限。随着机器学习技术在农业领域的渗透,数据驱动模型为作物生长预测提供了新思路。日本神奈川县SCI研究所的Yuto Kamiwaki与Shinji Fukuda团队注意到,现有研究尚未建立能够有效关联萝卜地上部生长与地下块根产量的预测模型,特别是在整合多源传感数据方面存在明显不足。

为此,研究人员以五种不同基因型的萝卜为研究对象(包括“樱丸”、“红铃”、“雪小町”等品种),在温室环境中通过iPad Pro搭载的LiDAR传感器持续采集植株点云数据,同步记录温度、湿度、露点温度、太阳辐射强度和灌溉量等环境参数。他们创新性地将点云数据通过绿度色谱筛选(绿度百分比>0.38)提取植株高度信息,并基于HSV/HSL颜色空间特征构建SPAD值(叶绿素相对含量)估算模型。

研究团队采用随机森林(Random Forests, RF)算法构建了两个核心模型:一是基于当日株高和环境数据的次日株高预测模型(PH模型),二是融入根裂信息的收获期产量预测模型(分最小、平均、最大重量三个子模型)。为验证模型普适性,同时对比了XGBoost和LightGBM算法的性能。模型解释方面采用SHAP值(SHapley Additive exPlanations)和部分依赖图(Partial Dependence, PD)等方法分析变量重要性。

关键技术方法包括:1)使用iPad LiDAR采集作物点云数据,通过CloudCompare软件进行位姿对齐和绿度滤波提取株高;2)部署多传感器网络监测温度、湿度、露点温度、太阳辐射等环境参数;3)基于随机森林构建SPAD值估算模型和生长预测模型;4)采用五折交叉验证评估模型性能,以相关系数(COR)、纳什效率系数(NSE)和均方根误差(RMSE)为评价指标;5)通过SHAP值和部分依赖图解析模型决策机制。

3.1 环境监测结果

温室环境呈现高温高湿特性,最高温度超过40°C,湿度常达100%。这种环境条件会促进萝卜地上部徒长而抑制地下块根膨大,导致生育期延长至37天(远超常规20-30天)。

3.2 作物表型变化

株高生长曲线呈现典型的S型增长趋势,但5月16日“雪小町”品种出现株高异常下降现象,可能与植株萎蔫有关。减少灌溉处理在生长后期(4月30日后)表现出明显的株高抑制效应。

3.3 生长预测模型

株高预测模型表现优异(COR>0.94,RMSE=2.44 cm),时间序列预测能准确捕捉缺水条件下的植株萎蔫动态。变量重要性分析显示前日株高是最关键预测因子,其次为试验田编号(可能反映微环境差异)。

3.4 产量预测模型

未融入根裂信息的模型对最小和平均产量预测精度较低(COR≈0.47),但对最大产量预测较好(COR=0.74)。融入根裂信息后所有模型精度显著提升(COR>0.85),最大重量预测模型表现尤为突出(COR=0.98)。SHAP分析表明品种、株高、灌溉量和根裂情况是影响产量的核心因素。

3.5 模型解释分析

部分依赖图显示:株高约21 cm时对应最大产量;减少灌溉导致重量降低;根裂程度与重量呈正相关。不同品种对环境因子的响应曲线存在显著差异,说明基因型-环境互作效应显著。

4.讨论

研究揭示了高温高湿环境对萝卜生长的双重影响:促进地上部生长但抑制块根膨大。试验田编号的重要性提示微环境变异(如土壤水分空间差异)对模型精度的影响,未来需布设更密集的传感器网络捕捉微环境变异。产量预测精度差异说明最小/平均产量受环境波动影响更大,而最大产量主要受品种特性控制。

根裂信息的重要性证实了地下性状与地上观测的关联性——严重根裂可通过地上部表现识别。研究建议建立品种特异性局部模型以提高预测精度,并需进一步厘清根裂(cracking)与空心化(hollowing)的生理机制差异。

5.结论

该研究成功构建了基于多模态传感数据和机器学习的萝卜生长与产量预测模型,证实了通过地上部表型信息和非侵入式环境监测预测地下性状的可行性。株高预测模型实现了日前尺度的精准预测(COR>0.94),产量预测模型在融入根裂信息后精度显著提升(COR>0.85)。研究发现品种、株高、灌溉量和根裂状态是影响产量的关键因素,为根茎类作物智慧栽培提供了理论依据和技术支撑。这项研究发表于《Smart Agricultural Technology》,标志着作物表型组学与农业信息技术融合迈出了重要一步。

生物通微信公众号
微信
新浪微博


生物通 版权所有