基于机器学习的模拟与优化:金属有机框架上磷酸盐的吸附过程

时间:2026年3月7日
来源:Separation and Purification Technology

编辑推荐:

MOFs用于磷酸盐吸附的高效机器学习预测框架及设计指南。整合2308个样本的多元特征(合成条件、吸附系统特性、材料特性、官能团、磷酸盐形态),基于梯度提升决策树模型(测试R²=0.948,RMSE=0.120)实现吸附容量精准预测。关键驱动因素包括吸附平衡浓度、反应时间、孔隙尺寸与体积协同作用、磷酸盐形态与有效水合半径。提出pH响应三阶段机制:pH2-6增强吸附(pH-pHzoc匹配、磷酸盐形态转变及官能团质子化),6-8平台期,8以上抑制。设计指南优先选择0.5-5nm孔径、100-150℃结晶温度、低温干燥的MOFs。

广告
   X   

Jie Huang|Ziang Zong|Penghui Wang|Yuxuan Zhang|Degui Gao|Yingqi Wang|Zhanjun Li
广州医科大学生物医学工程学院,中国广州511436

摘要

金属有机框架(MOFs)因其高表面积、可调的孔隙率和丰富的表面化学性质而成为有前景的磷酸盐吸附剂,然而合成过程与操作效果之间的耦合限制了其合理设计。在此,我们构建了一个集成机器学习(ML)框架,用于预测MOFs的吸附能力并识别关键的控制因素。该数据集包含来自38篇文献的2308个样本,涵盖了66个特征,包括合成条件(SCD)、吸附系统属性(ASP)、吸附剂特性(ACT)、功能基团(FGP)和磷酸盐形态(Pspec)。在测试的算法中,梯度提升决策树(Gradient Boosted Decision Trees)表现出最佳性能(测试R² = 0.948,RMSE = 0.120),具有很强的外部泛化能力。SHAP和部分依赖性分析表明,ASP和SCD对预测贡献最大,其次是ACT、Pspec和FGP。最具影响力的变量包括平衡浓度(logCe)、反应时间、剂量、pH-pHpzc关系、孔径(APS)与孔体积(Vt)之间的相互作用,以及α-H₂PO₄⁻与有效水合半径的组合。pH响应呈现出三阶段趋势:在pH 2–6范围内吸附增强,在pH 6–8范围内趋于平稳或略有下降,在pH高于8时受到抑制,这些变化由pH-pHpzc的对齐、磷酸盐形态的变化和功能基团的质子化驱动。该模型为初始材料筛选提供了启发式指导:优先选择孔径为0.5–5 nm、结晶温度为100–150°C且干燥条件温和(50–120°C,≤10小时)的MOFs。本研究提出了一种数据驱动的MOF设计策略,将吸附条件、孔结构、位点化学性质和磷酸盐形态联系起来,以指导高效的磷酸盐去除和资源回收。

引言

磷污染已成为一个严重的全球性挑战,这主要是由于农业集约化和工业扩张所致[1]。过量的磷酸盐排放引发了富营养化,导致缺氧、生态系统崩溃和水安全威胁[2]。虽然化学沉淀和生物去除等传统方法被广泛使用,但它们通常受到高污泥产生和二次污染的制约[3]。因此,基于吸附的技术因其高效性和资源回收潜力而受到重视。在各种吸附剂中,金属有机框架(MOFs)因其可调的孔隙率和丰富的表面化学性质而受到特别关注,这为选择性磷酸盐捕获提供了极好的机会[4],[5],[6]。
尽管MOFs在磷酸盐去除和回收方面具有巨大潜力,但在实际应用中仍面临多重挑战。水中磷酸盐的复杂形态及其对pH变化的敏感性使得难以精确控制MOFs的吸附行为[7]。MOFs的结构稳定性和表面化学性质对其吸附性能有显著影响,而这些又受到合成过程(如金属与有机物的比例、溶剂系统和反应温度)的严格限制[8],[9],[10]。尽管功能修饰可以提高吸附选择性,但往往会导致制备复杂、成本高昂和材料耐久性降低等问题[11]。例如,含铁或铝的MOFs能与磷酸盐离子形成强配位键,但在酸性条件下容易部分溶解,从而影响其可重复使用性[12]。此外,复杂水体系中的共存阴离子(如SO₄²⁻、NO₃⁻、CO₃²⁻)会与磷酸盐离子竞争吸附位点,从而降低去除效率[13],[14]。鉴于多种因素的耦合效应以及传统实验优化的局限性,迫切需要建立系统的MOF设计策略、机制阐明和性能预测方法,以实现对磷酸盐吸附和回收过程的精确控制。
机器学习(ML)作为一种强大的数据驱动工具,可以通过算法自动识别数据中的复杂关系,用于预测或优化,为MOFs的智能设计和性能调优提供了新途径[15],[16],[17]。与传统实验和经验方法相比,ML能够在庞大的特征空间中高效挖掘影响吸附性能的关键因素,实现材料属性的快速筛选和定量预测[18],[19],[20]。近年来,ML在磷酸盐去除和吸附剂研究中的应用日益广泛。例如,Zhou等人(2024年)引入了一种模糊描述策略,利用ML有效预测了不同吸附剂的磷酸盐吸附能力和动力学行为,从而在数据有限的情况下实现准确筛选[21]。Fu等人(2024年)使用梯度提升模型优化了金属改性生物炭的制备参数,揭示了金属负载量、固液比和pH在磷吸附性能中的主导作用[22]。这些研究表明,ML在阐明MOF-磷酸盐吸附机制、优化材料结构和提高预测效率方面具有显著优势,使其成为推动吸附材料智能发展的关键工具。
最近的进展进一步表明,大型语言模型(LLMs)正成为MOF研究的推动层,将数据驱动的筛选与合成决策和实验实现相结合[23]。据报道,领域训练的LLMs能够改进MOFs的结构-性质推理,并考虑合成可行性进行逆向设计,通过模型指导的迭代合成提出并实现候选框架[23]。同时,基于LLM的代理框架通过结合自动化数据分析、机制推理和协议导航(通过检索增强生成)来优化MOF合成,实现了合成策略的高效迭代和实验结果的改进[24]。此外,还开发了数据驱动的ML框架,包括系统模型比较、可解释性分析和作为交互式平台的部署,用于MOF吸附问题,这体现了将预测建模与可操作决策支持相结合的更广泛趋势[25]。受这一前沿的启发,我们的工作专注于构建一个可解释的ML框架,用于MOF-磷酸盐系统,并提取定量且与机制一致的设计指导,以便轻松集成到未来的LLM或代理驱动的研究流程中。
然而,现有的关于磷酸盐吸附的ML研究存在关键局限性。大多数现有模型仅关注操作条件(如pH、剂量),而忽略了合成条件(SCD)在决定吸附剂内在缺陷和结晶度方面的决定性作用。此外,现有研究往往将ML视为“黑箱”,缺乏对特定特征(如磷酸盐形态和水合半径)如何在分子层面驱动吸附行为的深入机制理解。尽管ML已应用于简单吸附剂,但针对MOFs的结构复杂性(整合孔特性、表面功能化和合成参数)的综合性框架仍然缺乏[26]。
为了解决这些不足,本研究建立了一个专为MOF-磷酸盐系统设计的全面、可解释的ML框架。与以往的研究不同,我们整合了一个多维特征空间,涵盖了SCD、吸附剂特性(ACT)、功能基团(FGP)、吸附系统属性(ASP)和磷酸盐形态(Pspec)。本研究的具体目标是构建一个大规模数据库(2308个样本),以训练一个强大的梯度提升决策树(GBDT)模型,用于准确预测吸附能力;利用SHAP(Shapley Additive Explanations)和部分依赖性分析来解耦孔结构、位点化学和合成参数的协同效应;并提出定量设计规则,确定最佳合成窗口和操作策略,以指导下一代MOF吸附剂的合理开发。

数据收集

数据收集

本研究系统地汇编了关于MOFs吸附磷酸盐的文献,主要数据来源是Web of Science数据库(WOS)。检索和筛选过程包括三个步骤:(1)初步搜索,基于预定义的关键词和逻辑组合进行系统搜索;(2)标题和摘要筛选,排除与研究主题不一致的文献;(3)对剩余研究进行全文审查,以最终确定数据集。

数据预处理结果和解释

初始数据集包含超过2430个独立数据点。由于来自不同来源的实验记录并不完全一致,某些特征存在大量缺失,pHpzc、BET、Vt和APS的缺失率分别为45.57%、12.12%、16.82%和21.70%,这突显了严格数据预处理的重要性。缺失的pHpzc数据使用相应吸附剂的典型文献值进行了补充,而BET、Vt和APS则通过

结论

本文利用2308个样本构建了一个多变量机器学习框架,用于MOF-磷酸盐系统。在评估的基于树的模型中,GBDT表现出优异的性能(测试R² = 0.948,RMSE = 0.120)和强大的泛化能力。机制分析表明,吸附能力主要受系统条件(ASP)和孔结构(ACT)之间的协同作用驱动。具体而言,模型揭示了高平衡浓度(Ce)和酸性条件

CRediT作者贡献声明

Jie Huang:撰写 – 审稿与编辑、研究、数据分析。Ziang Zong:撰写 – 原始草稿、方法论、研究、概念化。Penghui Wang:撰写 – 审稿与编辑、研究、数据分析。Yuxuan Zhang:撰写 – 审稿与编辑、研究、数据分析。Degui Gao:撰写 – 审稿与编辑、研究、数据分析。Yingqi Wang:撰写 – 审稿与编辑、研究、数据分析。Zhanjun Li:撰写 – 审稿与编辑,

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。

致谢

本研究得到了湖南省教育厅科学研究项目(编号:23B0534)、湖南省自然科学基金(编号:2023JJ40254)、湖南省自然科学基金青年学生研究基金项目(编号:2025JJ60934)、湖南省教育厅一般项目(编号:25C0494)以及中国学生创新与创业培训计划(编号:S202412604004)的支持。

生物通微信公众号
微信
新浪微博


生物通 版权所有