数据来源和描述符设计
本研究首先从文献中收集了可自由获取的羰基峰实验数据(来自Chengchun Liu [23])。然后使用这些预处理后的数据设计了两种描述符:RDKIt描述符和Mordred描述符,以捕捉分子的拓扑、几何和电子性质方面的信息。RDKIt描述符是通过RDKit开源化学信息学库计算得出的,而Mordred描述符则是通过...
描述符相关性
顶级描述符与IR特征羰基峰的相关性矩阵揭示了分子性质之间的关系。描述符“Partial Equalization of Orbital Electronegativities-Voronoi Surface Area Descriptor 9”(PEOE_VSA9)的相关系数为0.31,与羰基峰表现出最强的正相关性(图3)。PEOE_VSA9是一个与分子极性表面积相关的描述符,表明具有较大极性的分子...
结论
本研究采用机器学习方法,利用Modred和RDKit描述符预测含有羰基团的有机化合物的实验羰基峰。ET回归模型的决定系数R²值为0.72–0.78,证明了其在捕捉分子描述符与实验IR峰之间复杂关系方面的有效性。研究发现FractionCSP3是最具相关性的描述符,而BCUT2D_MRLOW(RDKit)和FCSP3(Modred)是最具影响力的描述符...
CRediT作者贡献声明
Sadaf Noreen:撰写 – 审稿与编辑、初稿撰写、软件开发、方法论设计、实验设计、数据分析、概念构建。
Mamduh J. Aljaafreh:撰写 – 审稿与编辑、初稿撰写、软件开发、方法论设计、数据分析、概念构建。
Ashour M. Ahmed:撰写 – 审稿与编辑、实验设计、数据分析、形式分析。
资金声明
本研究得到了伊玛目穆罕默德·本·沙特伊斯兰大学(IMSIU)科学研究办公室的支持和资助(资助编号:IMSIU-DDRSP2602)。
利益冲突声明
作者声明没有已知的财务利益或个人关系可能影响本文的研究结果。