基于机器学习模型预测铁皮石斛(Dendrobium officinale)多糖含量:揭示设施农业下优质产区的迁移

时间:2026年5月27日
来源:Scientia Horticulturae

编辑推荐:

铁皮石斛(Dendrobium officinale)是一种兼具药用与食用价值的传统珍贵药材,其品质直接影响临床疗效。随着野生资源日益稀缺,温室栽培与仿野生栽培已成为主要供应方式。然而,温室栽培铁皮石斛呈现出与野生品系显著不同的生长模式,设施农业的引入可能弱化

广告
   X   

铁皮石斛(Dendrobium officinale)是一种兼具药用与食用价值的传统珍贵药材,其品质直接影响临床疗效。随着野生资源日益稀缺,温室栽培与仿野生栽培已成为主要供应方式。然而,温室栽培铁皮石斛呈现出与野生品系显著不同的生长模式,设施农业的引入可能弱化温度、降水等自然因素对多糖积累的调控作用,进而导致优质产区的空间迁移。为系统评估这一变异规律,研究人员采集了不同产区、栽培模式及生长年限的铁皮石斛多糖含量数据。针对传统线性模型在刻画复杂非线性关系方面的局限,该研究引入机器学习模型以揭示其地理分布特征及关键环境驱动因子。结果表明,野生铁皮石斛多糖含量最高,传统栽培次之,仿野生栽培最低;3~4年生植株的多糖含量优于低龄植株。与传统线性模型相比,机器学习模型展现出更优的预测可靠性,其中XGBoost模型预测性能最佳。预测结果显示,野生铁皮石斛高含量区与传统认知一致,集中于云南及浙皖交界地带;而温室栽培使高含量区向云南、贵州及广西转移,关键环境因子亦由降雨和温度转变为海拔与日照。值得注意的是,研究人员发现当前铁皮石斛栽培布局仍受野生品质观念驱动,表明中药材种植仍囿于传统认知而忽视设施农业带来的变革。该研究将品质评价从产后分析推进至产前区划,为铁皮石斛精准农业与可持续资源利用提供了科学依据。
该研究发表于《Scientia Horticulturae》,聚焦于铁皮石斛多糖含量的空间预测与设施农业下的产区迁移问题。研究背景方面,铁皮石斛为兰科多年生附生草本,以茎入药,具滋阴清热、生津益胃之效,被誉为"九大仙草之首",其多糖成分被《中国药典》(2020年版)列为质量评价核心指标。然而,因附生特性导致自然繁殖率低,加之过度采挖,野生资源濒临枯竭,人工栽培成为必然选择。长期以来,野生药材活性成分含量优于栽培品系的认知根深蒂固,但温室栽培作为截然不同的生存模式,可能重塑环境因子与多糖积累的关联机制。传统线性模型及主成分分析等方法虽广泛应用于药用植物品质系统评价,却难以有效捕捉品质形成中复杂的非线性交互作用,而机器学习模型凭借计算效率高、预测精度优、可揭示复杂响应关系等优势,已在地理学、环境科学及生态学领域取得成功应用。

研究人员开展了一项覆盖全国尺度的大数据分析研究,旨在通过机器学习方法预测不同栽培模式下铁皮石斛多糖含量的地理分布特征,识别关键环境驱动因子,并明确优质产区空间格局。研究得出以下核心结论:不同栽培模式与生长年限显著影响铁皮石斛品质;野生品系多糖含量最高,传统栽培次之,仿野生栽培最低;3~4年生植株优于低龄植株;XGBoost模型预测可靠性优于传统线性模型;设施农业引入导致高含量产区向西南转移,核心驱动因子由水热条件转变为海拔与日照;当前栽培布局存在观念滞后性。该研究对推进中药材产业区域化、标准化发展具有重要理论与实践意义。

研究方法层面,研究人员首先构建了包含557个有效样本的数据集,样本来源涵盖58个野生样本、329个栽培样本及170个仿野生样本,数据采集自CNKI、Web of Science、Scopus等数据库公开发表的文献,多糖含量均以《中国药典》规定的苯酚-硫酸法统一量化,并严格排除非同行评审文献、数据不完整短篇通讯及检测方法不一致的研究。环境数据方面,选取了WorldClim数据库提供的22个气候因子及1个地形因子(海拔),包括年均温、昼夜温差、等温性、温度季节性、最暖月最高温、最冷月最低温、温度年较差、最湿季均温、最干季均温、最暖季均温、最冷季均温、年降水量、最湿月降水量、最干月降水量、降水季节性、最湿季降水量、最干季降水量、最暖季降水量、最冷季降水量、风速、水气压及太阳辐射,空间分辨率统一为30弧秒,地理坐标系为GCS_WGS_1984。模型构建方面,采用Boruta算法筛选关键环境变量,对相关系数大于0.8的变量保留贡献最大者;运用随机森林(RF)、XGBoost(XGB)、K近邻(KNN)三种机器学习模型及多元线性模型(MLM)进行预测,数据按70%训练集与30%测试集随机划分,经3折交叉验证进行超参数优化;模型性能以均方根误差(RMSE)、平均绝对误差(MAE)及决定系数(R2)评估;采用SHAP(SHapley Additive exPlanations)方法量化各因子贡献度;统计分析运用单因素方差分析及Tukey's HSD事后检验比较不同组间差异,显著性水平为P < 0.05。

研究结果部分呈现如下:

"地理分布特征":野生铁皮石斛广泛分布于中国南方,包括云南、浙江、广东、贵州、安徽、广西、江苏、江西及湖南等地;温室栽培主要集中于云南、浙江和安徽;仿野生栽培则以贵州省最为密集。该结论基于样本采集点分布与最大熵模型预测适宜性分析得出。

"不同栽培模式及生长年限下多糖含量变异特征":野生样本多糖含量均值最高(26.25%),传统栽培为24.27%,仿野生栽培为22.72%;超过《中国药典》25%阈值的样本比例分别为野生63.79%、传统栽培60.76%、仿野生栽培47.67%。生长年限方面,3~4年生植株超阈值比例为62.99%,1年生为59.38%,2年生为52.63%;均值排序为3~4年生(25.64%)> 1年生(24.93%)> 2年生(22.72%)。进一步分析表明,1年生植株以仿野生栽培多糖含量最高,2年生以野生最高,3~4年生以传统栽培最高;传统栽培模式下多年生植株积累最多,仿野生模式下1年生积累最多。省份比较显示,栽培品系以云南省多糖含量最高,浙江省种植面积虽大但含量显著偏低;野生品系以浙江省含量最高。

"基于机器学习模型的铁皮石斛品质生态评价":四种模型均达统计显著预测能力,但MLM因高RMSE、高MAE及低R2表现较差,机器学习模型则呈现更低误差和更高解释力。三种机器学习中XGBoost表现最优,故被选为后续预测模型。野生铁皮石斛形成两个高含量分布区,即云南及浙皖交界地带,含量可达35%~40%,与传统认知吻合。栽培品系的高含量区则显著转移,主要集中于云南省、贵州西南部、广西南部及福建西南部,海南省亦为潜在适宜区。仿野生栽培高含量区主要位于广西和广东,多数区域预计超25%阈值,此分布与野生品系差异显著,可能与仿野生研究有限及样本量较小有关。

"环境变量重要性评估":野生品系关键因子排序为:最暖季均温(Bio10)> 最湿月降水量(Bio13)> 最湿季降水量(Bio16)> 海拔(Elev)> 最暖月最高温(Bio5)> 昼夜温差(Bio2)> 温度年较差(Bio7)> 温度季节性(Bio4)> 太阳辐射(Srad)> 最干季降水量(Bio17),其中Bio13和Bio16起促进作用,Bio10起抑制作用。仿野生栽培关键因子为:Bio16 > 降水季节性(Bio15)> 年均温(Bio1)> 最湿季均温(Bio8)> 风速 > Bio2 > 年降水量(Bio12)> 最冷季均温(Bio11)> Bio13,Bio16呈正效应,Bio1和Bio15呈负效应。传统栽培关键因子为:海拔 > 太阳辐射 > 温度季节性(Bio4)> 最干季均温(Bio9)> 最暖季降水量(Bio18)> 水气压(Vapr)> Bio15 > 风速 > Bio8 > Bio1。随栽培模式改变,影响多糖积累的环境因子由温度和降雨转变为海拔和日照。

讨论部分,研究人员首先阐述了铁皮石斛的生态背景,指出其分布于海拔800~1600 m的腐殖质丰富、苔藓覆盖的悬崖或树干上,气候变暖、过度采挖及生境丧失导致野生种群锐减,而1990年代以来人工种植迅速扩张。研究证实铁皮石斛主要分布在华南地区,与其依赖温暖湿润条件的历史记录一致。传统栽培集中于浙江和云南两省,归因于优越的自然气候、丰富的野生资源及较高的多糖含量;贵州仿野生栽培最为密集,可能与当地持续高湿、适宜温度变化的微气候条件及60%的森林覆盖率所具经济与生态效益相关。

关于多糖积累机制,野生品系含量显著高于栽培品系,归因于自然竞争胁迫下的慢速生长促使资源更多分配给多糖等防御化合物。仿野生栽培呈下降趋势,暗示模拟环境无法完全复制真实野生生境的特定生物或非生物胁迫,或传统栽培的营养管理更有效支持多糖积累。3~4年生含量最高而2年生最低,可能处于开花或营养再生的资源再分配阶段。

机器学习模型验证方面,XGBoost优于传统线性模型的结论证实了人工智能在处理农业和生态非线性复杂数据中的优势。MLM的高误差与低解释力表明环境因子与多糖含量间并非简单线性或可加关系。基于XGBoost预测的仿野生适宜核心区为广西、海南、广东和福建;传统栽培适宜区为滇西南、黔西南、桂南及海南,为产业布局提供依据。

环境因子解析方面,野生品系中Bio13和Bio16促进多糖积累,Bio10起抑制作用,印证铁皮石斛偏好湿润环境、忌高温的特性。仿野生模式中,Bio16的促进效应符合生态生理学原理,充足水分可促进生物量增加与多糖合成;Bio1的抑制效应源于热胁迫导致酶活性受损及代谢重心向细胞保护转移;Bio15的负效应因干湿交替引发间歇性干旱胁迫。传统栽培中,海拔和太阳辐射成为主导因子,源于温室的环境缓冲效应有效缓解了自然温湿波动,但无法改变海拔相关的固地理特征(如UV辐射、大气压),亦无法完全控制太阳辐射,后者作为重要环境信号持续调控植物生长与代谢产物合成。

研究局限性在于:适宜栽培区预测基于大数据集整合分析,未来需结合区域土壤肥力、种植基础设施及农艺管理水平等实地条件;识别出的驱动因子需通过大规模、长期、多区域栽培试验进一步验证。

研究结论指出,该研究系统分析了不同产区、栽培方法和生长年限对铁皮石斛多糖含量的影响,并结合机器学习方法揭示其地理分布特征。铁皮石斛品质受栽培模式和生长年限显著影响,野生条件下多糖含量最高,传统栽培次之,仿野生栽培最低;3~4年生植株优于低龄植株。预测方面,XGBoost模型较传统线性模型可靠性更高。预测结果表明,温室栽培的引入不仅导致高含量产区向云南、贵州和广西转移,更使核心环境驱动因子由降雨和温度转变为海拔和日照,重塑了品质形成的环境基础。然而,当前种植布局仍受传统野生优质产区观念驱动,未能适应设施农业带来的变革,存在观念滞后。该研究将药材品质评价从产后分析推进至产前区划,为铁皮石斛精准农业规划和可持续资源利用提供了科学依据,对促进中药材产业向区域化、标准化发展具有重要意义。

生物通微信公众号
微信
新浪微博


生物通 版权所有