棉花纤维质量的地理空间化：迈向农场可追溯性与可预测性的一步

时间：2026年3月26日

来源：Precision Agriculture

编辑推荐：

本推荐旨在介绍一项关于棉花纤维质量空间变异与预测的创新研究。针对当前棉田精细管理因缺乏纤维质量空间数据而受限的难题，研究者整合了地理参考的收获数据与模块级质量记录，构建了365个“质量多边形”。他们利用随机森林模型，结合静态环境因子和多时相哨兵2号（Sentinel-2）植被指数数据，成功预测了八项关键纤维质量性状。研究结果表明，引入生长期动态遥感数据和空间异质性指标可显著提升模型精度，其最佳预测精度（R²）可达0.83。这为制定基于空间质量图谱的精准棉花管理策略奠定了技术基础，对提升作物价值和农场可追溯性具有重要意义。

对于棉花种植者而言，最终的收益不仅取决于产量，还取决于纤维的品质。然而，与早已普及的产量分布图不同，棉花纤维质量的空间数据却极为稀缺。这就好比一位厨师能精确知道一道菜用了多少食材，却无法掌控食材的品质分布——高品质与低品质的棉花在收获后常常混在一起，这使得精准管理和分等定价变得困难，也限制了农场主优化收益的潜力。因此，将棉花纤维质量“绘制”到田间地图上，实现其空间可视化与可预测性，成为精细农业领域一个亟待突破的关键环节。这项发表在《Precision Agriculture》上的研究，正是为了回答这个问题：我们能否像绘制产量图一样，精准绘制并提前预测棉田不同区域的纤维质量？

为了解答上述问题，研究团队在美国佐治亚州的10个商业化棉田中，设计并实施了一套创新的数据整合与建模方案。其核心技术方法主要包括：1) 数据链接与空间化：利用约翰迪尔（John Deere）的收获识别系统，将带有时间戳的收割机产量数据与同样有时间记录的圆形棉包（Module）创建事件相匹配，通过地理信息系统处理，构建出代表每个棉包来源田块区域的“质量多边形”，并与美国农业部高容量仪器测试获得的纤维质量数据关联，最终生成了涵盖365个多边形的空间数据集。2) 多源预测变量获取：为每个多边形收集了静态（如土壤质地、地形）和动态预测变量。动态数据主要来自多时相哨兵2号卫星影像，计算了归一化植被指数、绿光归一化植被指数和重归一化植被指数三种植被指数，并按三个物候期（早、中、晚）分别计算了其中位数（Med）和曲线下面积的中位数与变异系数，以捕捉时空动态与空间异质性。3) 机器学习建模与验证：使用随机森林算法建立预测模型，评估了仅用静态数据、逐步加入不同物候期动态数据以及是否包含空间异质性（变异系数）对预测八项纤维质量性状（如上半部平均长度、强度、马克隆值等）精度的影响。模型通过留一田块交叉验证来严格评估其在未采样新田块上的泛化能力。

研究结果通过多个方面系统地揭示了棉花纤维质量的空间变异规律及其预测潜力。

模块质量多边形：研究成功构建了连接纤维质量数据与具体地理位置的流程。生成的365个质量多边形平均面积约为6，436平方米。可视化分析显示，纤维质量的变异常与土壤质地、地形及植被指数的空间格局相吻合，但也存在棉包边界横跨多个环境异质区域的情况，这凸显了在分析纤维质量时考虑收割作业空间异质性的重要性。

纤维质量的时空变异：所有八项纤维质量性状在田间均表现出显著的空间变异。其中，杂质含量和叶屑等级的变异系数最高（分别达11-21%和6-12%），而均匀度指数和反射率的变异最小（低于2%）。将观测值与行业标准阈值对比发现，尽管大多数田块的纤维长度表现理想，但在强度和马克隆值等关键指标上，部分田块有相当比例的棉包落入了不同等级区间，这直接影响其市场价值。

多模型双变量回归：回归分析揭示了预测变量与纤维质量间的显著关系。虽然单个预测变量的解释力有限（最佳模型R²在0.01到0.15之间），但最具影响力的预测因子主要来自晚季的植被指数动态变量。例如，纤维长度与晚季绿光归一化植被指数曲线下面积中位数呈正相关；纤维强度与晚季重归一化植被指数曲线下面积中位数呈线性平台关系；马克隆值则与晚季绿光归一化植被指数曲线下面积中位数呈负相关。在24个最佳模型中，有22个依赖于来自时间序列影像的动态植被指数，凸显了其在预测中的核心作用。

机器学习预测：随机森林模型表明，加入时序植被指数数据能普遍提升预测精度。平均测试集R²从仅使用静态数据时的0.52，提升到加入早季数据后的0.69，再加入全季数据后达到0.74。同时，在预测变量中纳入空间异质性（变异系数）进一步改善了大多数性状的模型性能。例如，纤维强度的R²从0.68提升至0.72，叶屑等级从0.70提升至0.75。纤维反射率的预测精度最高，最佳情况下R²达到0.83。

留一田块交叉验证：为评估模型在新环境下的泛化能力，研究采用了留一田块交叉验证。结果显示，对未采样田块的预测准确性普遍低于随机拆分数据集的基准模型。在不同质量参数中，纤维长度和反射率的预测相对较好（平均R²约为0.10），而叶屑等级和强度等参数则更难一致性地预测（R²低于0.03）。不同田块间的可预测性也存在差异，这表明模型的性能受到训练数据是否充分代表新田块独特条件的影响。

在结论与讨论部分，研究者强调，本研究展示的工作流程将模块级纤维质量数据与地理空间位置链接，实现了质量变异绘图和预测模型开发。研究证实了纤维质量存在显著的时空变异，其中颜色和杂质相关性状变异最大，而这正是影响棉花价格的主要因素。一个关键发现是，晚季（尤其是吐絮期）的遥感数据是预测纤维质量最有信息的指标，这与棉纤维次生壁加厚等关键发育阶段的生理过程相吻合。此外，研究创新性地将预测因子在“质量多边形”内的空间异质性（变异系数）作为模型输入，发现其能有效提升大多数质量性状的预测精度，这为了解田间非均匀性对纤维品质一致性的影响提供了新视角。

尽管机器学习模型在随机数据分割下表现出良好性能，但留一田块交叉验证揭示了模型在应用于全新田块时面临的“环境独特性”挑战，预测性能明显下降。这说明要建立普适性强的预测模型，需要覆盖更广泛环境、品种和管理实践的训练数据集。未来研究需要整合天气数据、遗传信息及其他农艺管理变量，并探索更高分辨率遥感数据的融合，以进一步提升模型的准确性和适用性。

总之，这项研究为实现棉田纤维质量的空间化制图与预测迈出了关键一步。它证明，结合多时相遥感数据和空间异质性信息，可以有效地预测纤维质量，为支持基于质量差异的精准收获、分等加工和营销决策提供了科学依据和技术框架，最终助力提升棉花生产的整体价值与可持续性。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部