利用近红外和中红外光谱数据融合建模快速测定柴油密度

时间:2026年2月5日
来源:Fuel

编辑推荐:

针对柴油密度快速检测难题,本研究通过MIR与NIR光谱融合及PLS建模优化,构建了高精度密度预测模型,RMSEP降至0.35 kg/m³,R²达0.99,较传统方法提升7.89%–82.93%,验证了优化数据融合策略的有效性。

广告
   X   

丁朝阳|康颖|刘安妮|郭晓燕|张正东|童俊婷|李珂|刘帆|宋晓萍|严勇|李琦|陶宏
中国国家计量研究院环境计量中心,北京100029

摘要

密度是柴油的重要物理和化学性质,与其在发动机中的燃烧性能密切相关。确保精炼油市场中的柴油质量需要快速且准确的密度测定。虽然密度计方法作为一种标准技术具有很高的准确性,但其复杂性和漫长的分析时间限制了其在快速现场检测中的适用性。中红外(MIR)和近红外光谱(NIR)常用于快速油品检测。MIR和NIR的光谱融合同时反映了含氢基团振动的基本频率、泛音频率和组合频率吸收,有效解决了单一光谱方法在表示分子结构信息方面的局限性。结合化学计量模型,这种方法通过解决传统数据整合策略的局限性,形成了一种新的快速柴油密度测定方法。使用MIR和NIR光谱,在四种预处理条件下(无预处理、Savitzky-Golay一阶导数、Savitzky-Golay二阶导数和向量归一化)构建了PLS模型,分别对单光谱以及低级别、中级别、高级别和优化的高级别(Opt-HLDF)光谱数据进行了融合。在不同的光谱预处理条件下,最佳单光谱、低级别和中级别数据融合模型的均方根预测误差(RMSEP)分别为1.10、0.84和0.38 kg/m³,预测决定系数(R²)分别为0.98、0.98和0.99,证明了低级别和中级别数据融合在提高预测性能方面的有效性。然而,高级别数据融合模型在外部验证中的表现较差,RMSEP和R²值分别为1.75 kg/m³和0.95。为了解决这个问题,通过使用最优单光谱结果的性能基准筛选子模型,开发了Opt-HLDF-PLS模型。Opt-HLDF-PLS模型在外部验证中取得了最佳性能,RMSEP和R²值分别为0.35 kg/m³和0.99,相比其他模型提高了7.89%–82.93%的外部验证准确性,并有效缓解了传统高级别融合中常见的预测不稳定性。F检验和T检验确认了优化的高级别数据融合方法的精确度和准确性与标准方法高度相当。总之,本研究基于NIR和MIR开发了一种优化的高级别光谱数据融合模型,实现了准确且快速的柴油密度测定。

引言

柴油是一种重要的石油衍生物,随着全球工业化的加速,它已成为中国的主要能源消耗产品之一,广泛应用于交通运输和机械生产。随着柴油需求的持续增长,提高柴油质量被视为向清洁能源过渡的关键步骤,旨在减少碳排放和改善空气质量[1]。柴油的密度是其质量的关键指标,直接影响燃料在发动机中的正常运行。当密度过高时,挥发性降低,难以蒸发,导致燃烧不完全;相反,当密度过低时,挥发性过高,会导致发动机发生汽锁现象[2]。
根据ISO 3675《原油和液态石油产品。实验室密度测定》,标准的密度测定方法是密度计法[3]。尽管这种方法确保了高测量精度,但其分析时间较长(例如需要足够的时间去除密度计中的气泡)以及操作程序复杂。这些步骤包括将样品筒放置在没有气流的位置,将密度计压在液体平衡点以下1-2毫米处,并根据液面形状判断干燥管是否需要清洁。这些限制使得密度计方法仅适用于实验室操作,不适合快速现场检测。因此,开发一种结合高速、操作简单、非破坏性采样和高测量精度的快速分析方法对于监管机构提高柴油质量监督、保护公共利益和确保环境安全至关重要[4]。
中红外光谱(MIR)可以反映含氢基团的基本频率信息[5]。近红外光谱(NIR)反映了含氢基团(如C–H、N–H、O–H)在 macromolecules 和 complexes 中的泛音频率和组合频率吸收信息,涵盖了大多数有机化合物的化学组成和分子结构信息[6]。由于柴油主要由复杂的碳氢化合物组成,红外光谱结合化学计量学已被证明是分析燃料物理化学性质的强大工具。例如,L. L. Monteiro等人[7]使用傅里叶变换近红外光谱(FT-NIR)开发了一种主成分分析-线性判别分析(PCA-LDA)模型来确定柴油中的生物柴油含量。他们的模型在验证集上的决定系数为0.99,均方根误差为0.10%(v/v),表明NIR技术与化学计量模型的结合能够准确测定混合物中的生物柴油含量。同样,Benavides等人[8]使用MIR开发了一种偏最小二乘(PLS)模型来确定汽油的研究辛烷值(RON),超过80%的PLS模型结果落在标准方法的重复性和不确定性范围内。这些研究突显了MIR和NIR结合化学计量模型在快速检测油品方面的巨大潜力。然而,依赖单一光谱技术来获取被测组分的化学信息相对片面,难以获得更全面、可靠和丰富的化学信息[9]。
数据融合技术结合了来自同一批样品的多个仪器检测源的不同数据,充分考虑了不同技术来源数据集之间的互补性和协同作用[10]。这种方法生成了更具体、全面和科学的目标数据集。研究人员已将光谱数据融合技术应用于快速油品检测。例如,Chen等人[10]将紫外(UV)和NIR数据连接起来,构建了一个偏最小二乘(PLS)模型来确定乙醇-柴油中的乙醇含量。他们的结果显示,UV-NIR融合光谱的PLS模型比单光谱模型的预测误差更低,从而实现了准确的乙醇含量测定。同样,Moro等人[11]融合了NIR和MIR数据,开发了一个偏最小二乘判别分析(PLS-DA)模型,用于识别低氮和高氮原油以及轻质、中等和重质原油。他们的结果表明,数据融合判别模型的识别准确率超过了94%。与单光谱技术相比,数据融合技术可以有效提高模型预测性能。这种改进是由于NIR和MIR光谱数据的融合,使得能够同时获取含氢基团的基本频率、泛音频率和组合频率信息,从而提供了更全面和可相互验证的分子结构信息,最终提高了模型的预测性能。
为了解决这个问题,引入了数据融合策略——分为低级别(LLDF)、中级别(MLDF)和高级别(HLDF)——以整合来自多个来源的互补信息。虽然LLDF和MLDF在石化分析中得到了越来越广泛的应用,但HLDF的潜力尚未得到充分探索,并且在该领域经常产生不一致的结果。传统的HLDF方法在外部验证中经常表现出性能下降,这是由于平衡子模型权重或丢失协同光谱特征的挑战所致。因此,开发一个比单光谱和低级别融合模型具有更高预测准确性的优化HLDF框架至关重要。本研究提出了一种改进的HLDF策略用于柴油密度测定,有效整合了NIR和MIR数据,并显示出比传统融合技术更高的外部验证稳定性。

样本收集和光谱获取

从北京牛栏山油库共收集了147个汽车柴油样本,包括70个0#柴油样本、32个−10#柴油样本、18个−20#柴油样本和27个−35#柴油样本。这些等级根据GB/T 19,147标准根据其冷滤堵塞点(CFPP)进行分类,该指标表示低温流动性及相应的适用最低环境温度。
NIR光谱是使用Spectrum Two NTM仪器收集的

NIR和MIR光谱分析

NIR光谱反映了分子振动的泛音频率和组合频率信息。138个柴油样本的NIR光谱显示在图4(A)中。8200–9100 cm−1区域包含C–H键(CH3)第二泛音的特征吸收峰。7050–7320 cm−1区域包含C–H键(CH2)组合频率的特征吸收峰。5610–5700 cm−1和5700–5850 cm−1区域包含...

结论

本研究成功展示了通过各种数据融合策略整合近红外(NIR)和中红外(MIR)光谱,建立了一个稳健的PLS模型用于柴油密度测定。系统比较表明,虽然低级别(LLDF)和中级别数据融合(MLDF)相比单光谱模型提高了预测准确性,但本研究中开发的优化高级别数据融合(HLDF)框架取得了最大的进步。

CRediT作者贡献声明

丁朝阳:撰写 - 原始草稿,正式分析。康颖:撰写 - 审阅与编辑,验证,数据管理。刘安妮:可视化。郭晓燕:方法论。张正东:调查,正式分析。童俊婷:数据管理。李珂:撰写 - 审阅与编辑,监督,项目管理,资金获取,数据管理,概念化。刘帆:监督。宋晓萍:概念化。严勇:正式分析,数据管理。李琦:方法论。陶宏:

利益冲突声明

作者声明他们没有已知的竞争财务利益或个人关系可能影响本文报告的工作。

生物通微信公众号
微信
新浪微博


生物通 版权所有