关于机器学习在优化基于藻类的吸附剂对重金属吸附作用中的应用的研究

时间：2026年1月20日

来源：Algal Research

编辑推荐：

微藻作为重金属吸附剂，其效能优化结合机器学习建模，通过构建包含3692个数据点的多变量体系，分析生物特性与实验条件对吸附效率的影响，发现实验条件（如生物量、初始浓度、pH值等）比生物特性更重要，且存在非线性对抗关系。Extra Trees模型表现最佳，R²达0.9653，验证了分数据集预测的适用性。

李敖强|杨鹏|沈瑶|张磊|孟凡伟

中国矿业大学低碳能源与动力工程学院，江苏省徐州市大学路1号，221116，中国

摘要

微藻是用于从水溶液中去除重金属的有前景的生物吸附剂，而机器学习（ML）是优化其吸附性能的强大工具。本研究开发了一个ML框架，以优化基于微藻的吸附剂的重金属去除效果，并阐明其背后的调控机制。通过系统回顾71篇已发表的文献，构建了一个包含3692个数据点（10个与微藻生物特性和吸附条件相关的输入变量）的数据集，其中吸附效率作为输出变量。根据每种微藻专门用于吸附一种特定重金属的原则，该数据集被进一步划分为12个子数据集。训练并验证了十个ML模型，并使用Shapley加性解释（SHAP）分析与部分依赖图（PDP）来解释特征重要性和变量相互作用。结果表明，Extra Trees模型的表现优于其他模型，其最大测试集决定系数（R²）为0.9653，最小均方根误差（RMSE）为4.7024。特征重要性排名显示，实验条件对吸附效率的影响比微藻的生物特性更为显著。此外，SHAP和PDP分析还发现了生物质浓度与初始重金属浓度之间的关键非线性拮抗作用。子数据集预测模式因其计算成本较低而适用于实验前场景，而全数据集模式则更适用于广谱废水处理预测。本研究为基于微藻的重金属吸附剂的合理开发和优化提供了理论支持。

引言

快速的工业化、城市化以及相关的技术进步导致了环境污染、全球变暖和气候变化。根据2020年的统计数据，全球市政、农业和工业废物总量达到了70-90亿吨[1]。随着燃料价格的上涨、石油储备的枯竭和环境问题的恶化，全球对可持续废物管理技术和生物资源回收转化技术的需求日益增长。由于微藻具有复杂的孔隙结构和表面功能，它们常被用于从废水中吸附重金属、染料和其他潜在污染物[1]。微藻在吸附染料、重金属和气体排放方面表现出低成本、高效率和环境友好性的特点，因此在其环境修复应用中受到了越来越多的关注[2]。重金属对生态系统中的植物和动物构成威胁，并对人类健康构成重大风险，可能导致疾病，包括癌症、神经肌肉控制缺陷、智力障碍和肾功能障碍[3]。金属离子的去除性能和机制在一定程度上取决于原材料、合成条件和污染水平等多种因素。研究人员对使用微藻生物质进行生活和工业废水生物修复的文献进行了综述[4]，并对微藻生理学、大规模和工业规模微藻生产及其生物修复能力进行了全面回顾[5]。此外，还总结了微藻物种多样性在废水处理中的应用及其生物修复能力[6]，以及微藻在含毒和含金属介质中生长的抗性机制及其去除过程[7]。

微藻可以在含有污染物的工业废水中等危险环境中培养。微藻细胞壁中的金属结合蛋白能够结合金属离子，使其成为理想的生物吸附剂。微藻具有成本效益高、金属吸附能力强和在吸附稀释废水方面效率高的优点，使其成为一种可行的生物吸附方法。另一个优势是它们能够去除K、P和N等元素，实现多重生物去除[4]。某些微藻可以特异性吸附土壤中的重金属，同时在固氮、供氧、分泌促进植物生长的物质和促进土壤团聚体形成方面发挥重要作用[8]。

20世纪50年代首次提出了使用微藻处理废水的方法，并且在利用微藻处理含重金属废水方面取得了显著进展[8]。研究评估了微藻开放池塘培养系统中药物化合物及其代谢物的去除能力[4]，开发了使用固定化微藻细胞处理富镉废水的新方法[9]，研究了Scenedesmus obliquus去除废水中的苯酚-3的机制[10]，分析了四种微藻在实验室规模上对不同污染物的去除机制[11]，使用四种微藻识别了废水中抗生素的多种分解产物[12]，并总结了通过基于微藻的废水处理进行营养物回收的工作[13]。研究表明，微藻不仅可以吸附重金属，还可以吸附药物废物[14]、营养物质、有机污染物[15]等，对水污染物具有全面的净化效果。它们在电厂废水处理中去除多种污染物的作用也得到了验证[16]。目前，研究人员已将机器学习技术引入到微藻的研究中，包括物种鉴定[17]、生长过程监测[18]和生物特性分析[19]。

本研究重点关注基于微藻材料的重金属吸附复杂系统。通过收集和整理文献构建数据集，打破了传统模型中关于单一影响因素的线性假设限制，从而能够高效预测微藻吸附剂的工程应用性能。这些发现有望扩展机器学习在生物基材料性能预测中的应用。本研究为复杂环境条件下的重金属污染控制提供了智能解决方案。机器学习在微藻重金属吸附研究中的关键价值在于其能够模拟一组复杂变量之间的非线性关系。与传统试错实验相比，它可以快速筛选出最佳吸附条件，降低实验成本和时间。

部分内容

实验方法

本研究的第一部分集中在数据收集上，所有数据均来自71篇已发表的文献。具体来说，收集的数据的输入变量分为两类：一类涉及与微藻生物特性相关的变量，对应6篇文献[20]、[21]、[22]、[23]、[24]、[25]；另一类包括与微藻吸附重金属的实验条件相关的变量[26]，涵盖了65篇文献

统计分析

在数据集训练中，输入变量包括十个参数，输出变量为重金属吸附效率。数据密度和分布如图1所示，展示了每组输入变量的最小值、最大值和中位数，以分析原始数据。对于C（%），最小值为33.16%，最大值为53.5%，数据主要分布在44.7%到50%的范围内。对于H（%），

不同微藻子数据集的结果

为了研究减少数据量和变量对预测的影响，构建的数据集被划分为十二个子数据集进行单独训练。每个子数据集包含一种微藻吸附一种金属。按微藻种类分类可以减少四个代表微藻种类的特征变量（C、H、O、N），而按重金属种类分类可以减少一个代表重金属的特征变量（Metal）。数据集的输入特征变量

结论

本研究应用了10个ML模型来研究微藻的重金属吸附能力。数据集的总数为3692个。ET模型的表现最佳，其R²高达0.9653。实验条件的重要性顺序为：生物量 > 初始浓度 > pH > 时间 > 金属 > 温度。在12个子数据集的研究中，最优模型各不相同。将整个数据集划分为子数据集进行预测的方法可以确保稳定性

CRediT作者贡献声明

李敖强：撰写——审阅与编辑，撰写——初稿，验证，软件，方法论，调查，正式分析，数据管理。杨鹏：撰写——审阅与编辑，监督，资源管理，项目管理，资金获取，概念构思。沈瑶：撰写——审阅与编辑，软件，方法论，调查。张磊：撰写——审阅与编辑，监督。孟凡伟：撰写——审阅与编辑，监督。