柴油是一种重要的石油衍生物,随着全球工业化的加速,它已成为中国的主要能源消耗产品之一,广泛应用于交通运输和机械生产。随着柴油需求的持续增长,提高柴油质量被视为向清洁能源过渡的关键步骤,旨在减少碳排放和改善空气质量[1]。柴油的密度是其质量的关键指标,直接影响燃料在发动机中的正常运行。当密度过高时,挥发性降低,难以蒸发,导致燃烧不完全;相反,当密度过低时,挥发性过高,会导致发动机发生汽锁现象[2]。
根据ISO 3675《原油和液态石油产品。实验室密度测定》,标准的密度测定方法是密度计法[3]。尽管这种方法确保了高测量精度,但其分析时间较长(例如需要足够的时间去除密度计中的气泡)以及操作程序复杂。这些步骤包括将样品筒放置在没有气流的位置,将密度计压在液体平衡点以下1-2毫米处,并根据液面形状判断干燥管是否需要清洁。这些限制使得密度计方法仅适用于实验室操作,不适合快速现场检测。因此,开发一种结合高速、操作简单、非破坏性采样和高测量精度的快速分析方法对于监管机构提高柴油质量监督、保护公共利益和确保环境安全至关重要[4]。
中红外光谱(MIR)可以反映含氢基团的基本频率信息[5]。近红外光谱(NIR)反映了含氢基团(如C–H、N–H、O–H)在 macromolecules 和 complexes 中的泛音频率和组合频率吸收信息,涵盖了大多数有机化合物的化学组成和分子结构信息[6]。由于柴油主要由复杂的碳氢化合物组成,红外光谱结合化学计量学已被证明是分析燃料物理化学性质的强大工具。例如,L. L. Monteiro等人[7]使用傅里叶变换近红外光谱(FT-NIR)开发了一种主成分分析-线性判别分析(PCA-LDA)模型来确定柴油中的生物柴油含量。他们的模型在验证集上的决定系数为0.99,均方根误差为0.10%(v/v),表明NIR技术与化学计量模型的结合能够准确测定混合物中的生物柴油含量。同样,Benavides等人[8]使用MIR开发了一种偏最小二乘(PLS)模型来确定汽油的研究辛烷值(RON),超过80%的PLS模型结果落在标准方法的重复性和不确定性范围内。这些研究突显了MIR和NIR结合化学计量模型在快速检测油品方面的巨大潜力。然而,依赖单一光谱技术来获取被测组分的化学信息相对片面,难以获得更全面、可靠和丰富的化学信息[9]。
数据融合技术结合了来自同一批样品的多个仪器检测源的不同数据,充分考虑了不同技术来源数据集之间的互补性和协同作用[10]。这种方法生成了更具体、全面和科学的目标数据集。研究人员已将光谱数据融合技术应用于快速油品检测。例如,Chen等人[10]将紫外(UV)和NIR数据连接起来,构建了一个偏最小二乘(PLS)模型来确定乙醇-柴油中的乙醇含量。他们的结果显示,UV-NIR融合光谱的PLS模型比单光谱模型的预测误差更低,从而实现了准确的乙醇含量测定。同样,Moro等人[11]融合了NIR和MIR数据,开发了一个偏最小二乘判别分析(PLS-DA)模型,用于识别低氮和高氮原油以及轻质、中等和重质原油。他们的结果表明,数据融合判别模型的识别准确率超过了94%。与单光谱技术相比,数据融合技术可以有效提高模型预测性能。这种改进是由于NIR和MIR光谱数据的融合,使得能够同时获取含氢基团的基本频率、泛音频率和组合频率信息,从而提供了更全面和可相互验证的分子结构信息,最终提高了模型的预测性能。
为了解决这个问题,引入了数据融合策略——分为低级别(LLDF)、中级别(MLDF)和高级别(HLDF)——以整合来自多个来源的互补信息。虽然LLDF和MLDF在石化分析中得到了越来越广泛的应用,但HLDF的潜力尚未得到充分探索,并且在该领域经常产生不一致的结果。传统的HLDF方法在外部验证中经常表现出性能下降,这是由于平衡子模型权重或丢失协同光谱特征的挑战所致。因此,开发一个比单光谱和低级别融合模型具有更高预测准确性的优化HLDF框架至关重要。本研究提出了一种改进的HLDF策略用于柴油密度测定,有效整合了NIR和MIR数据,并显示出比传统融合技术更高的外部验证稳定性。