在环境监测、工业、农业和水产养殖等多个领域,对液相中关键成分的在线监测需求正在迅速增长。近红外光谱(NIRS)由于其快速、无损检测和低成本等优点,在食品、制药、化工和环境监测等领域得到了广泛应用[1],[2]。它已成为替代传统化学分析方法的关键技术之一,特别是在液相参数检测领域[3],[4],[5]。然而,传统的液相NIRS检测主要在实验室环境中采用离线光谱数据采集方式。这种方法依赖于在固定实验室环境中进行手动样品处理和检测,导致缺乏实时检测能力,并可能因样品处理或环境差异而产生一致性问题。与离线测量相比,在线检测要求光谱系统具有更高的稳定性、紧凑性和实时性能。因此,有必要开发基于微控制器的近红外光谱数据采集系统。
STM32系列微控制器具有处理速度快、功耗低和抗干扰能力强等优点,被广泛应用于控制领域[6]。与传统基于PC的离线软件解决方案相比,STM32具有更小的系统体积、更高的集成度以及出色的电源恢复能力和环境适应性。因此,以STM32为核心控制器开发液相近红外光谱系统有望提高系统稳定性并实现便携式部署[7]。
在液相样品输送方面,大多数现有设计采用手动、蠕动泵或连续流注射方法。这些方法存在样品采集不一致、气泡干扰和流量不稳定等问题,从而影响光谱采集的重复性和准确性[8],[9],[10]。为满足液相物质检测的需求,引入了一种包含双缓冲瓶结构、液位传感器和脉宽调制器(PWM)的闭环控制策略来控制水泵[11],[12]。这种方法有效提高了样品输送稳定性,减少了气蚀干扰,并改善了采样一致性。此外,系统应采用稳定高效的通信机制,以确保样品注入的稳定性和光谱数据采集的精确控制[13]。
在可靠的硬件系统支持下进行数据采集时,高维性和高度冗余特性导致的“维度灾难”问题成为近红外光谱数据分析面临的主要挑战[14],[15]。液相样品的近红外光谱通常包含数百到数千个波长变量[16]。直接回归建模不仅计算复杂度较高,还容易引入噪声变量,导致模型过拟合和泛化性能较差[17]。因此,有效的特征波长选择是提高建模性能的关键步骤。广泛使用的竞争性自适应加权采样(CARS)[18]算法通过蒙特卡洛采样构建多个偏最小二乘(PLS)模型,基于交叉验证均方根误差(RMSECV)选择最优波长组合,在建模精度和波长压缩之间取得平衡,适用于具有大量冗余变量的液相样品的特征提取任务[19]。
此外,高维光谱数据包含复杂的非线性关系,使得传统的线性回归方法不适合高精度建模[20]。近年来,极端学习机(ELM)及其变体(如核极端学习机(KELM)和深度极端学习机(DELM)因其快速训练速度和强大的建模能力而受到关注,成为光谱建模的重要工具[21],[22]。然而,这些模型的性能高度依赖于超参数的调整,如隐藏层节点数量、正则化系数和核函数参数[23]。如果没有合理的参数优化机制,容易发生过拟合或欠拟合。引入启发式智能优化算法进行非线性回归模型的参数优化是提高建模精度的一种常见方法[24]。
基于上述分析,本研究旨在构建一个由STM32控制的液相近红外光谱数据采集系统,以解决硬件层面的在线采样物理稳定性问题。在评估光谱数据采集稳定性后,进一步评估了收集数据的质量。通过采集氨氮溶液和啤酒样品,使用CARS特征波长选择和通过粒子群雀搜索算法(PSSA)优化的多个ELM模型作为评估工具,验证了系统的光谱数据可用性和质量。