通过红外光谱法表征针状焦原料的官能团组成:实验与模拟技术

时间:2026年5月16日
来源:Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy

编辑推荐:

丹尼斯·O·波塔波夫|金塔拉斯·A·格利亚乌德利斯|伊利亚·V·科帕尼丘克|德米特里·A·斯比托夫|尼基塔·A·克罗特科夫|蒂穆尔·A·阿列耶夫|安东·A·穆拉维耶夫|尼古拉·D·康德拉季尤克|叶卡捷琳娜·V·斯科尔巴尔 俄罗斯莫斯科 **摘要** 本研究探讨了利用

广告
   X   

丹尼斯·O·波塔波夫|金塔拉斯·A·格利亚乌德利斯|伊利亚·V·科帕尼丘克|德米特里·A·斯比托夫|尼基塔·A·克罗特科夫|蒂穆尔·A·阿列耶夫|安东·A·穆拉维耶夫|尼古拉·D·康德拉季尤克|叶卡捷琳娜·V·斯科尔巴尔
俄罗斯莫斯科

**摘要**
本研究探讨了利用红外光谱结合分子建模和数据驱动分析来表征炼焦原料官能团组成的能力。通过对工业原料的FTIR光谱进行分析,使用了基于描述符的指标来捕捉芳香族、饱和烃和含氧基团的贡献。为了在受控条件下评估光谱组成关系,采用了分子动力学(MD)模拟来生成具有已知组成的代表性烃类混合物的合成IR光谱。线性化学计量模型能够充分恢复总体组成分数,而神经网络模型则提高了CH3/CH2比率的预测精度。多变量曲线解析实验光谱识别出三个与预定义光谱指数一致的可重复潜在组分。所提出的工作流程能够在下游处理之前对原料组成进行半定量、基于描述符的比较。

**引言**
针状焦的生产是石化工业中的一个关键过程,旨在制造具有高导电性、热稳定性和机械强度的碳材料[1]、[2]、[3]、[4]、[5]。这类材料广泛用于冶金工业电极、电池和其他先进碳材料的生产[6]、[7]、[8]、[9]。针状焦的主要质量标准是各向异性结构、低杂质含量和高石墨化程度[10]。
针状焦特定性质的形成取决于初始烃类原料的特性和技术工艺的条件。关键的原料组成参数包括芳香烃、沥青质、树脂的含量,以及硫和有机金属化合物等不希望存在的杂质的低含量[1]、[11]。同时,炼焦过程伴随着复杂的化学变化,这些变化会显著改变碳材料的结构,从而增加了对其性质的预测难度。
成功的焦炭质量管理需要一种综合方法,能够识别原料的化学特性与其在炼焦过程中的行为之间的关联。实验表征技术被广泛用于探究石油焦的组成和结构演变。例如,X射线光电子光谱和FTIR已被结合用于模拟煅烧前后的结构变化[12]。大量研究表明,特定的IR吸收带反映了羟基、羰基、芳香族及其他官能团的相对丰度,其演变过程与活化、芳香族缩合和热分解过程相关[13]、[14]、[15]、[16]。
尽管这些研究建立了光谱特征与焦炭结构之间的定性关系,但对复杂原料中重叠带的定量解释仍然具有挑战性。正如刘等人[17]所指出的,光谱描述符与原料性质之间的系统相关性为经验建模提供了基础,但需要稳健的多变量校准框架。
在石油馏分中,FTIR结合多变量校准方法(特别是偏最小二乘法(PLS)回归)已成功用于烃类类别分数的定量估计。例如,基于PLS的FTIR分析已被应用于确定精炼流中的烷烃、烯烃、环烷烃和芳香烃含量,并与气相色谱参考方法结果高度一致[18]。类似的方法也被用于从振动光谱预测石油产品的蒸馏性质和其他总体特性[19]。这些先前的研究证明了FTIR在焦炭研究中的定性解释能力以及化学计量建模在复杂烃类混合物中的定量能力。
与此同时,分子模拟技术越来越多地被用于解释凝聚相系统的振动光谱[20]、[21]。在经典分子动力学(MD)框架内,红外光谱可以通过偶极矩时间相关函数的傅里叶变换获得,这与线性响应理论一致[22]、[23]、[24]、[25]、[26]、[27]。与谐波正常模式方法[28]、[29]、[30]、[31]、[32]不同,基于MD的方法自然地考虑了非谐性、温度效应和分子间相互作用。
这些方法已成功应用于包括液态水[33]、有机液体(如苯[34])和半结晶聚合物[35]在内的体系,模拟结果再现了关键的实验光谱特征并实现了结构解释。尽管这些模拟无法在化学异质混合物中提供物种分辨分析,但它们为将混合物组成与振动光谱特征联系起来提供了物理基础。
机器学习的最新进展进一步扩展了红外光谱作为数据驱动分析工具的应用范围。卷积神经网络、循环架构和基于变压器的模型已被应用于从纯化合物的IR光谱预测官能团甚至完整的分子结构[36]、[37]、[38]、[39]、[40]、[41]。例如,阿尔伯茨等人[40]在大型模拟光谱数据集上训练了变压器模型,并在单分子结构识别方面展示了竞争性性能,而吴等人[39]引入了基于补丁的注意力机制来提高光谱分辨率处理能力。
然而,大多数现有的机器学习方法侧重于孤立分子或定义明确的官能团分类,其中峰重叠相对有限。应用于石油馏分等化学异质体系的情况要复杂得多,因为观察到的光谱代表了多种重叠振动贡献的叠加。在这种情况下,目标从分子识别转变为恢复总体组成描述符,这促使人们系统地评估线性化学计量和非线性机器学习模型在混合物水平上的分析能力。
本研究开发了一种实用的工作流程,用于从中红外光谱中提取针状焦原料的混合物级组成描述符。首先,我们为工业FTIR测量建立了统一的预处理和描述符计算程序,并使用这些描述符作为芳香族、饱和烃、支化和含氧基团贡献的操作标志。其次,我们构建了代表性的多组分烃类混合物,并通过经典MD计算其IR光谱,以生成带有组成标签的参考数据,从而能够控制地评估光谱-组成关系和线性光谱分解策略。最后,我们使用无监督化学计量方法分析实验原料光谱,以解析潜在的光谱组分及其在样本间的相对丰度。总体而言,该框架提供了一种基于描述符的半定量方法,用于评估与下游处理相关的原料组成。

**实验和建模方法**
在本节中,我们描述了与机器学习方法结合使用的实验和模拟技术细节。实验方法用于定性表征由我们的工业合作伙伴提供的原始原料组成。

**基于MD光谱的宏观组成预测**
将NNLS分解应用于我们的合成数据集表明,总体IR光谱可以准确地重建为分子贡献的线性组合。
在此正向指纹重建的基础上,我们解决了逆问题:直接从光谱预测混合物级组成描述符。我们考虑了环烷烃、烷烃和芳香族-沥青质组合的质量分数,以及常被用作关键指标的CH3/CH2比率。

**结论**
我们开发了一种结合实验和计算的工作流程,用于分析与针状焦生产相关的石油原料的官能团组成。该框架整合了(i)工业样品的FTIR测量、(ii)代表性多组分烃类混合物的分子动力学(MD)模拟以及(iii)数据驱动的光谱分析方法。
在模拟方面,我们生成了1000个含有不同比例CRediT成分的模拟样本。

**作者贡献声明**
丹尼斯·O·波塔波夫:概念化、研究、方法论(模拟和机器学习)、数据整理、可视化、初稿撰写。
金塔拉斯·A·格利亚乌德利斯:计算方法论、合成数据生成、数据后处理。
伊利亚·V·科帕尼丘克:分子模型开发、模拟支持。
德米特里·A·斯比托夫:实验测量、数据处理、可视化、撰写。
尼基塔·A·克罗特科夫:机器学习模型开发、数据处理。
蒂穆尔·A·阿列耶夫:

**利益冲突声明**
作者声明他们没有已知的可能会影响本文报告工作的财务利益或个人关系。

**致谢**
本工作部分得到了俄罗斯联邦科学与高等教育部根据协议编号075-03-2026-305(2026年1月16日)的支持(多组分分子模型的生成)。计算工作在莫斯科物理技术学院计算物理中心的Soft Cluster上进行。

生物通微信公众号
微信
新浪微博


生物通 版权所有