引言
金因其优异的导热性、导电性、延展性、可塑性和耐腐蚀性而被广泛应用于医疗器材和历史建筑等领域。其资产价值也在逐年攀升,金价从2022年的每克50美元翻倍至2025年的100美元。目前,全球每年产生9350万吨电子废弃物(e-waste),其中所含的金比从矿山中提取的金纯度更高,因此高效回收电子废弃物中的金具有显著的环境和经济效益。传统的金回收方法如沉淀法、吸附法和膜分离法存在纯度低、选择性差和能耗高等局限性。相比之下,溶剂萃取法能够以高纯度和高萃取率回收金,显示出明显优势。在金的溶剂化萃取(离子溶剂化萃取)中,Au(III)在酸性氯化物介质中以四氯金酸(HAuCl4)的形式存在,可被有机溶剂萃取。目前工业上常用的金萃取溶剂是二丁基卡必醇(DBC),其在5 mol/L盐酸(HCl)中萃取率高达98.2%,且具有高金选择性、粘度低(2.40 mPa·s)和闪点高(391 K)等优异特性。然而,DBC的水溶性较高(3.0 g/dm3),会导致有机相污染和溶剂损失,使连续操作变得困难。因此,本研究旨在寻找兼具高金萃取率和低水溶性的新型萃取溶剂。
研究方法
本研究构建了机器学习模型来预测溶剂的萃取率(E)和水溶性(S)。对于E的预测,使用了包含100种化合物(如酮类、醚类、羧酸类和烃类)的实验数据集。E的计算公式为:E [%] = ([Au(III)]org,eq/ [Au(III)]aq,init) × 100 = (([Au(III)]aq,init- [Au(III)]aq,eq) / [Au(III)]aq,init) × 100。实验条件为:5 M HCl,初始Au(III)浓度1.0 × 10–3mol/dm3,有机相与水相体积比1:5(O/A = 0.2),30 °C下以120 rpm搅拌1.0小时。对于水溶性S,使用了Hou等人报告的1290种化合物的对数水溶性(log S)数据集。
解释变量X包括通过RDKit计算的分子描述符(如分子量、环数)、表示子结构存在与否的MACCSKeys结构指纹,以及通过COSMO-RS方法计算的电荷密度分布(σ-profile)。σ-profile将分子表面划分为小片段,量化分子表面正负电荷区域的数量,从而可以描述溶剂分子与AuCl4–和质子的相互作用。为了获得高精度且可解释的模型,研究采用了遗传算法(GA)进行变量选择。对于波形数据σ-profile,采用了基于遗传算法的区域波长选择(GAWLS)方法,该方法能选择有意义的连续区域而非单个变量点。GAWLS的编码规则中,每个区域由起始变量和该区域的变量数量两个值表示。模型验证采用双重交叉验证(DCV),对于小样本量的E数据集,外层折采用留一法交叉验证。为确保预测的E值在0%到100%之间,对E进行了logit转换:Z = log(E / (1 - E)),构建回归模型Z = f(X)后,再通过逆logit变换E = exp(Z) / (1 + exp(Z))得到预测的E值。
结果与讨论
首先,与使用汉森溶解度参数(HSPs)等传统方法的预测模型(r² = 0.705)相比,结合RDKit、MACCSKeys并采用Boruta算法进行变量选择的模型(使用偏最小二乘法PLS)预测精度显著提高(r² = 0.943)。然而,该模型对中等E值的化合物预测值偏高,对高E值化合物预测值偏低,存在高估或漏选优质溶剂的风险。单独使用σ-profile作为解释变量的模型预测精度较低(r² = 0.747),且存在较多异常值。
通过GAWLS对σ-profile进行区域选择后发现,σ在0.010 e/Å2附近和-0.010至-0.020 e/Å2范围内的区域组合对E预测有效。最终,结合RDKit、MACCSKeys和σ-profile,并应用GAWLS进行变量选择(将选定区域的表面面积之和作为解释变量)的PLS模型取得了最佳预测性能(r² = 0.964,MAE = 4.78,RMSE = 8.64)。该模型数据点更贴近实际值与预测值的对角线,异常值较少。
对所选σ-profile区域的分析揭示了萃取机理。所选区域(0.001–0.018 e/Å2)代表分子表面存在能吸引质子的负电荷区域;而区域(-0.014至-0.011 e/Å2)则用于判断是否存在能中和负电荷的正电荷区域。例如,高萃取率的DBC在负电荷区域有显著峰,但在正电荷区域无明显峰,表明其通过负电区域吸引质子,进而使AuCl4–作为抗衡离子被萃取。而低萃取率的庚酸在负电荷区域有峰,但在正电荷区域也有峰(负σ值),正负电荷相互抵消,导致萃取率低。庚烷在所选区域则无明显峰值,萃取率极低。一些中等E值的化合物(如二异丁基酮和辛酰苯)因σ-profile与DBC相似但在正电荷区域无峰,导致模型高估其E值。此外,从RDKit和MACCSKeys中选择的变量也符合预期,如MaxAbsPartialCharge(最大原子局部电荷绝对值)、ExactMolWt(精确分子量,影响溶剂分子数量)、以及C=O(酮基)和O>1(醚键)等结构特征,这与已知酮类和醚类能提高萃取率的报道一致。
对于水溶性log S的预测,使用RDKit描述符并采用高斯过程回归(GPR)构建的模型表现出色(r² = 0.93,MAE = 0.53,RMSE = 0.37),预测值在整个范围内与实际值吻合良好。
最后,研究利用构建的E和S模型对Namiki Shoji数据库中的342种商业可用化合物(主要包含酮和醚结构)进行逆向分析,寻找同时满足log S < -1.86(S < 3.0 g/dm3)和E > 98.2%(优于DBC)的溶剂。预测结果显示有62种化合物潜力优于DBC。从中选取6种进行实验验证,其E值均超过90%,且预测值与实验值偏差很小。其中,(-)-小茴香酮((-)-fenchone)和4-苯基-2-丁酮(4-phenyl-2-butanone)表现出与DBC相当的萃取率,同时预测水溶性更低,有望成为具有应用前景的新型金萃取溶剂。
结论
针对DBC溶剂水溶性高导致有机污染的问题,本研究成功构建了高精度的机器学习模型来预测溶剂的黄金萃取率(E)和水溶性(S)。通过引入COSMO-RS计算的σ-profile并结合GAWLS区域选择算法,显著提升了E预测模型的性能。模型分析为理解金(以AuCl4–形式)的萃取机理提供了新视角,即溶剂分子通过其表面的负电荷区域吸引质子,进而间接萃取AuCl4–。逆向分析筛选出多个预测性能优于DBC的候选溶剂,并经实验验证了其高效性。这项研究为开发更绿色、高效的金回收溶剂提供了有力的数据驱动方法,有助于减少溶剂损失和环境污染,推动资源回收技术的发展。