在中医药宝库中,霍山石斛(Dendrobium huoshanense )作为珍稀药食同源植物,其核心功效成分——霍山石斛多糖(DHP)的含量直接决定产品品质。然而当前市场存在两大困境:传统检测方法需破坏样品且流程繁琐,无法满足产地快速筛查需求;不同采收批次间多糖含量波动显著(实测范围21.93%-44.42%),部分农户为追求产量提前采收,导致产品质量参差不齐。这种现状不仅影响消费者营养摄入体验,更引发市场对霍山石斛食用品质的信任危机。
为破解这一行业难题,安徽中医药大学研究团队在《Journal of Food Composition and Analysis》发表创新性研究,首次将便携式近红外光谱仪(900-1700 nm)与可解释机器学习相结合,建立起DHP快速定量分析方法。该研究通过对比四种建模策略发现,经多元散射校正(MSC)联合二阶导数(2nd D)预处理、结合无信息变量消除(UVE)算法优化的随机森林回归(RFR)模型表现最佳,测试集预测性能达R²=0.863±0.072,RMSE=1.915±0.299,RPD=3.058±0.753。尤为重要的是,研究引入SHAP可解释性框架,首次揭示1601.87 nm、1025.79 nm和1428.43 nm等特征波段与多糖分子结构的定量关联机制。
技术方法层面,研究团队采用系统化建模流程:采集157批霍山石斛样本的近红外光谱后,先通过蒙特卡洛采样法剔除异常样本,继而比较SNV(标准正态变量变换)、MSC、SG(Savitzky-Golay)平滑、一阶/二阶导数等预处理方法效果,再应用CARS(竞争性自适应重加权采样)、UVE、RF(随机青蛙)三种算法筛选特征波长,最终构建BP-ANN(反向传播人工神经网络)、PLSR(偏最小二乘回归)、RFR和1D-CNN(一维卷积神经网络)四种定量模型。
研究结果呈现多维度突破:
• 多糖含量测定 :紫外分光光度法测定显示6个批次样本DHP含量均符合《中国药典》标准,其中第3批次平均含量最高达40.31%,证实方法适用于实际品质监控
• 异常样本识别 :通过均值-标准差散点图精准识别15、37、58等8个异常样本,为模型稳健性奠定基础
• 预处理方法优化 :发现BP-ANN模型最适合SNV预处理,PLSR模型在SNV+SG平滑组合下表现最优,而RFR和1D-CNN分别最适配MSC+2nd D和MSC预处理
• 特征波长筛选 :CARS算法为不同模型筛选出4-24个核心波长,UVE算法选出56-66个特征波长,RF算法筛选35-46个关键变量,大幅提升模型效率
• 模型性能对比 :横向比较显示RFR模型综合性能最佳,训练集R²达0.976±0.001,测试集R²为0.863±0.072,且SHAP分析揭示其关键特征波长1428.43 nm与多糖吡喃环骨架振动高度相关
讨论部分深入阐释了光谱特征与多糖结构的构效关系:1601.87 nm波段对应多糖分子羟基氢键网络振动,1025.79 nm反映C-H键与糖苷键骨架信息,1428.43 nm则关联吡喃环分支程度。这种结构-光谱对应关系为近红外定量分析提供了理论依据。相比既往研究,本方法创新性实现三个突破:采用便携设备突破实验室检测局限,引入可解释机器学习增强模型透明度,建立适用于野外检测的标准化流程。
该研究成功构建了霍山石斛多糖现场快速定量技术体系,为珍稀药材资源保护与市场质量监管提供了关键技术支撑。所提出的“光谱采集-算法优化-模型解释”一体化解决方案,对推动中药材质量控制从实验室走向产地具有示范意义,也为其他药用植物的无损检测提供了可复用的技术范式。未来通过扩大样本多样性、开展跨设备验证,该技术有望成为中药材质量标准化进程中的重要工具。
打赏