**摘要**
在传统的甲基苯丙胺(MA)合成过程中,副产物的普遍形成严重降低了最终产物的纯度,这一问题需要复杂且成本高昂的下游纯化策略来应对。为了克服这些限制,本研究引入了基于分子印迹聚合物(MIP)的纳米聚合物,作为分离MA及其主要代谢物安非他明(AMP)的高选择性、高效且经济的替代方案。通过批量聚合合成了一种新型的MA-imp-HEMAT和AMP-imp-HEMAT纳米聚合物,并使用FTIR、Zeta电位、颗粒大小分析和SEM对其进行了全面表征。这些聚合物表现出极高的结合能力,MA的结合能力为1039 mg/g,AMP的结合能力为967 mg/g,且交叉反应性极低(相对Q值分别为1.27%和2.46%)。两种纳米聚合物都展现了优异的可重复使用性,在连续五次循环中保持超过95%的解吸效率。为了提高数据精度并减少实验资源需求,本研究采用了基于高斯噪声的采样和基于插值的数据库增强方法。通过Kolmogorov–Smirnov(K-S)检验确认了增强数据集的准确性,其中CatBoost方法取得了最低的MAE(平均绝对误差)。在AMP-非imp-HEMAT系统中,支持向量机(SVR)表现出了最佳的泛化能力(R² = 0.8946)。本研究提出了一个结合实验与计算方法的混合框架,将选择性的MIP纳米聚合物设计与数据驱动的建模相结合,用于高精度预测分析物的结合行为。所提出的方法为传统的色谱纯化方法提供了一种可扩展且资源高效的替代方案,对制药级MA和AMP的生产具有直接的应用价值。
## 1 引言
安非他明类合成药物(ATSs)因其对中枢神经系统的刺激作用以及在某些情况下的致幻效果而广为人知。虽然一些ATSs被用于非医疗用途,但许多ATSs也具有明确的治疗作用。根据2020年的报告,近年来ATSs的全球使用量有所增加,据报道2020年有约3400万人使用了安非他明[1, 2]。安非他明(AMP)不仅作为一种治疗剂,还是甲基苯丙胺(MA)的主要代谢物。除了娱乐用途外,基于安非他明的物质如AMP还被合法用于治疗注意力缺陷多动障碍(ADHD)等医疗状况,它们能够增强儿童和成人的注意力、冲动控制和认知功能[3-5]。研究表明,MA和AMP可以调节多巴胺能和去甲肾上腺素能通路,这可能在某些临床情况下有助于提高清醒度和昼夜节律调节[6, 7],并且在常规方法无效时被用于治疗肥胖[8, 9]。低剂量的AMP给药已被研究用于缓解MA依赖症的戒断症状,可能是通过稳定中枢多巴胺活性实现的[8]。此外,控制性的AMP给药可能在帕金森病中提供神经保护作用,从而改善运动和认知功能[10]。在美国,MA和AMP的生产受到缉毒局(DEA)的监管,每年都有生产配额限制。2024年,DEA设定的安非他明类生产配额约为55,000公斤[11]。AMP的主要工业合成方法之一是在还原剂存在下,用氨或合适的胺源对苯丙酮(P2P)进行还原胺化,这种方法因其高产量和效率而被广泛采用[12]。另一种常见的合成方法是使用甲基化剂(如碘甲烷或甲醛/甲酸混合物)对AMP进行甲基化[13]。在制药环境中,MA和AMP的合成遵循良好生产规范(GMP)标准,确保最终产物满足严格的纯度要求[14, 15]。使用高效液相色谱(HPLC)和气相色谱-质谱(GC–MS)等色谱技术可以去除不需要的副产物,获得适合医疗使用的高纯度物质[16, 17]。然而,传统的色谱技术面临处理时间长、样品纯化能力有限以及运营成本高等挑战[18]。本研究的主要目标是开发一种高效且选择性的MA和AMP纯化方法,以解决这些挑战以及传统合成过程中副产物形成的关键问题。分子印迹聚合物(MIPs)提供了一种克服这些限制的替代方法,具有高选择性的分离能力[19-21]。与传统分离方法相比,MIPs具有更高的选择性、成本效益、更短的处理时间和更好的可重复使用性[19]。这些优势使得MIPs在选择性提取应用中非常有吸引力。在文献中,基于MIP的提取系统已被广泛研究用于从体液和废水等复杂基质中分离MA和AMP[22-24]。然而,很少有研究使用MIPs在MA的合法生产过程中进行纯化,特别是针对去除合成相关的副产物和提高产品纯度。在此背景下,本研究介绍了AMP-imp-HEMAT和MA-imp-HEMAT纳米聚合物,它们在合成后的中间阶段或最终纯化之前表现出卓越的分离能力,无需额外的纯化步骤。这种新方法不仅提高了纯度,还提供了成本和时间效率更高的替代方案,符合我们改进制药生产过程的目标,其中高选择性和严格的质量标准至关重要。在涉及结构相似的分析物(如MA及其主要代谢物AMP)的分子印迹研究中,由于化学差异很小,精确区分结合性能尤其具有挑战性。在我们的系统中,单个甲基基团区分了MA和AMP,这种结构接近性对印迹纳米聚合物的选择性和准确性提出了严格要求。为了解决这个问题,我们采用了数据增强技术来提高MA-imp-HEMAT或AMP-imp-HEMAT结合特性的分辨率和连续性,而不增加实验工作量。通过扩展不同pH值和浓度范围内的Q值覆盖范围,尤其是在实验重复次数较少的系统中,数据增强使我们能够在各种条件下精细化地比较印迹和非印迹行为[25, 26]。这不仅仅是对有限数据集的补偿,这种策略还允许我们以化学上合理的方式模拟未经测试的实验方案,将实证数据与计算建模相结合。在MA和AMP纯化场景中,由于时间、材料成本和受控物质处理的法规限制,收集密集的高分辨率结合谱图受到阻碍。在这种情况下,数据增强通过减少所需的实证测试次数,同时保持科学严谨性,支持可持续的实验设计[27]。数据增强技术不仅仅是针对有限数据集的响应,越来越多地被应用于减少实验工作量、优化实验室资源的使用以及加速数据驱动的发现。在涉及纳米结构MIP的结合研究中,生成每个实验数据点可能需要消耗大量的化学试剂、时间和一次性材料。这些增强方法的选择和实施并非随机进行,而是基于最近的研究,这些研究强调了在数据量低的化学建模任务中特定策略的重要性。最近的研究日益强调数据增强在增强化学约束实验领域预测建模中的关键作用。Schieimer等人[28]展示了在高信号变异性的建模系统中高斯扰动的有效性。同样,Song等人[29]提出了一种加权插值框架,用于在数据量低的环境中改进软传感模型,使未测试区域的学习更加平滑。Maharana等人在一项更广泛的综述中强调了将增强技术与数据集的分布特性相匹配的重要性,以保持语义和结构的完整性。基于这些发现,本研究将特定于分析物的增强应用扩展到分子印迹系统中,通过对具有较高实验噪声的AMP数据应用高斯扰动,并对MA数据应用基于插值的采样,实现了更平滑和化学上连贯的结合趋势。与通用增强流程不同,我们的方法结合了物理化学推理和数据驱动的建模,从而为MA和AMP纯化提供了一个更具选择性和资源效率的框架。这种增强设计不仅反映了当前的方法学最佳实践,还响应了MA和AMP系统所面临的特定统计和物理化学约束。随着数据增强扩大了实验观察的范围和细粒度,特别是在涉及复杂纳米聚合物系统的结合研究中,机器学习(ML)提供了一个计算框架,用于系统分析这种丰富的数据景观。通过揭示高维数据集中的潜在模式,ML使得能够建模和预测由结构和环境变量之间的复杂关系所控制的选择性结合行为[31]。在MIP研究中,这些关系通常包括分析物浓度、pH值、单体比例和交联剂密度,所有这些因素都以非线性和多变量的方式相互作用,传统分析模型可能无法捕捉到。在将ML集成到MIP设计工作流中时,必须考虑能够有效建模纳米聚合物系统中复杂相互作用的特定ML范式和算法。ML方法大致分为两大类:回归和分类[32]。尽管分类模型不是本工作的主要关注点,但在更广泛的MIP研究中已被有效用于区分高亲和力和低亲和力的聚合物或预测二元结合结果[33]。回归模型特别适合于估计连续输出,例如结合能力(Q, mg/g),这对于评估纳米聚合物-分析物相互作用的效率和选择性至关重要[33]。在我们的MA和AMP研究中,基于回归的建模允许在变化的pH值和浓度条件下定量比较MIP和非印迹聚合物(NIP)系统,提供了对非特异性结合贡献的细致见解。根据数据结构和建模目标,可以应用多种ML算法。例如,支持向量机(SVM)在纳米聚合物科学中得到广泛应用,因为它们能够处理高维空间和非线性关系[34]。集成决策树算法(如随机森林)在建模印迹效率方面表现出色,成功地识别了主导的配方变量[35]。在我们的研究中,选择了CatBoost,因为它能够处理异构数据结构和分类输入变量,且预处理要求较少,如Ileri的工作中所概述的[36]。此外,还结合了高斯过程回归(GPR),提供了一个能够建模预测不确定性的概率框架,这一特征对于实验重复次数较少的设计尤为重要,如Wang等人所详细说明的[37]。将这些ML算法集成到MIP建模流程中,并不是为了替代实验验证,而是一种战略性的扩展,它使得假设的细化和设计空间的优先级得以实现。预测性模拟可以指导选择最有可能产生高亲和力、选择性结合结果的配方参数和测试条件。通过这种方式,ML通过识别结构-性能关系,加强了回顾性分析和前瞻性优化。本研究开发了一个混合实验-计算框架,用于研究分子印迹聚合物(MIPs)及其非印迹类似物的选择性结合特性。通过整合实验纳米聚合物合成、结合研究、数据增强和监督机器学习,该框架在最小化资源使用的同时,提高了解释深度。这种跨学科方法促进了了对安非他明类刺激剂系统中纳米聚合物-分析物相互作用的理解,并强调了计算工具在指导未来合成策略中的价值。一个关键目标是解决传统MA和AMP合成中的挑战,其中副产物降低了纯度并需要大规模纯化。所提出的基于MIP的纳米聚合物系统能够在合成后的中间阶段或纯化之前选择性地分离MA和AMP,从而在实现高纯度产品的同时显著节省成本和时间。该系统为具有严格质量要求的制药制造过程设计,其集成先进的建模算法提供了可扩展且实用的解决方案,超越了法医应用的范畴,支持改进的工业过程控制和分析。
## 2 材料与方法
本节介绍了用于设计和评估MIPs的实验和计算方法,这些MIPs专为选择性识别MA及其结构相似的代谢物AMP而设计,以获得用于下游过程的高纯度MA和AMP。鉴于MA和AMP之间仅相差一个甲基基团的微妙化学差异,印迹过程需要极高的分子保真度以实现选择性结合。为了应对这一挑战,本研究结合了先进的纳米聚合物合成技术、数据增强策略和基于机器学习的预测建模。这种混合框架的开发旨在提高印迹精度,减少实验工作量,并促进在多种物理化学条件下对纳米聚合物-分析物相互作用的高分辨率映射。
2.1 材料和设备
L-色氨酸(≥98%),亚硝酸钠(NaNO2,≥99%),碳酸钾(K2CO3,≥99%),甲基丙烯酰氯(≥97%),乙腈(ACN,99.9%),2-羟基乙基甲基丙烯酸酯(HEMA,≥97%),乙二醇二甲基丙烯酸酯(EGDMA,工业级,约98%),过硫酸铵(APS,≥98%),亚硫酸氢钠(NaHSO3,≥98%),碳酸氢钠(NaHCO3,≥99.7%),盐酸麻黄碱(≥98%)和盐酸安非他明(≥98%)均从Sigma-Aldrich购买。本研究中使用的所有化学品均为分析级或更高纯度,确保了实验程序中材料的准确性和可靠性。纳米聚合物的合成是在热水浴(Wisd Wise Bath WSB-30)中进行的。结合实验使用的是旋转器(Wisd WiseMix RT-10)。UV-Vis光谱数据使用ThermoScientific Evolution 60分光光度计采集。合成聚合物的ζ电位和粒径分析是在爱琴大学核科学研究所实验室使用Nano Zetasizer(NanoS,Malvern Instruments,伦敦,英国)进行的。
2.2 功能单体的合成
在功能单体中使用了具有对MA和AMP亲和力的L-色氨酸。选择L-色氨酸的理由是,我们的模板分子MA和AMP由于其苯环结构和甲基而具有疏水性。这使得模板分子能够建立二级相互作用,如氢键、疏水相互作用和范德华力[38]。因此,在选择功能单体时,考虑了N-甲基丙烯酰-(L)-色氨酸甲酯的疏水性质和氢键潜力。合成N-甲基丙烯酰-(L)-色氨酸甲酯是为了将L-色氨酸作为单体纳入p(羟基乙基甲基丙烯酸酯)结构中。此外,还优化了合成过程以确保产生足够的N-甲基丙烯酰-(L)-色氨酸甲酯。通过在不同摩尔比的L-色氨酸和NaNO2存在下,在水溶性K2CO3中反应,确定了N-甲基丙烯酰-(L)-色氨酸甲酯合成的最佳条件。对于功能单体的合成,将L-色氨酸(5克)和NaNO2(0.2克)溶解在30毫升5%的K2CO3溶液中,并冷却至0°C。然后在惰性气氛下缓慢加入甲基丙烯酰氯(4毫升),并在室温下磁力搅拌2小时。调整溶液的pH值(pH:7.0)后,使用乙酸乙酯进行萃取。通过旋转蒸发器去除液相,然后用醚和环己烷结晶N-甲基丙烯酰-(L)-色氨酸甲酯。最后,通过在乙醇中重结晶进一步纯化粗产品[39]。将MATRP的最终浓度调整为300毫克/毫升以供后续使用。该过程采用了文献中描述的步骤,并进行了必要的修改[40]。
2.3 纳米聚合物的合成和表征
在MIP技术中,优化是实现高印迹效率和提高对模板分子选择性的关键[41]。因此,进行了聚合优化,以确保合成的MA-imp-HEMAT和AMP-imp-HEMAT表现出最大的选择性。为了找到最佳条件,准备了三种不同的预复合物。在这些预复合物的制备过程中,MA和AMP的量保持不变,而功能单体的体积则有所不同。对于1毫克的MA,分别向10微克的乙腈中加入25微升、50微升和80微升的功能单体,得到MIP-1、MIP-2和MIP-3。这些混合物在25°C下在旋转器上溶解1小时。对AMP进行相同处理。预复合物形成后,向溶液中加入0.5毫升的2-羟基乙基甲基丙烯酸酯单体和0.25毫升的乙二醇二甲基丙烯酸酯交联剂,并使用磁力搅拌器与预复合物溶液混合。在氮气下放置30分钟后,加入0.03毫克的过硫酸铵引发剂。MA-imp-HEMAT和AMP-imp-HEMAT的单体混合物在70°C下聚合7小时。聚合后,将纳米聚合物以1800转/分钟的速度离心1小时以分离它们。为了去除杂质和未反应的单体,用50/50的水-乙醇混合物清洗聚合物。所得的MA和AMP印迹聚合物在30°C的烤箱中干燥1天。作为对照组,使用相同的程序合成了未印迹的HEMAT纳米聚合物。在聚合过程中从纳米聚合物结构中去除模板分子会形成与模板分子形状、大小和化学选择性识别位点相同的空腔[42]。聚合后,使用适当的清洗溶液断开模板与单体之间的键,从而获得具有特定空腔的聚合物。为了从MA-imp-HEMAT和AMP-imp-HEMAT纳米聚合物中去除模板分子,将纳米聚合物在甲醇:乙腈(49:1)混合物中旋转2小时。清洗过程按照文献指南[43]进行。重复清洗直到清洗溶液中不再检测到MA或AMP。使用UV–VIS分光光度计监测模板去除情况[44]。模板提取后,用50%的乙醇-水混合物多次清洗纳米聚合物以去除杂质。每次清洗后都进行14,100转/分钟的离心,以将纳米聚合物与清洗介质分离。无模板纳米聚合物重新分散在70毫升的去离子水中并储存在4°C。为了获得与模板分子结合率最高的MA-imp-HEMAT和AMP-imp-HEMAT纳米聚合物,优化了聚合步骤。进行了表征程序,以全面阐明合成纳米聚合物的形态结构、稳定性和亲和性质。对MA-imp-HEMAT和AMP-imp-HEMAT纳米聚合物进行了傅里叶变换红外光谱(FTIR 8000系列,Shimadzu,日本)分析,以检查其化学键结构。使用扫描电子显微镜(SEM,Philips XL-30S FEG)详细研究了纳米聚合物的表面形态。此外,还进行了原子力显微镜(AFM)分析,以进一步分析纳米聚合物的表面形貌。还测量了合成纳米聚合物的ζ电位和粒径。对于这些测量,将1毫升的纳米聚合物溶液注入ζ电位分析装置的样品室中以确定表面电荷。从之前的合成和结合实验中获得的实证发现为后续的计算建模提供了基础输入。
2.4 数据增强用于扩展结合谱
数据增强过程被设计为实验工作流程的一个组成部分,旨在减少材料消耗和实验室时间,同时能够更细致地探索更广泛参数范围内的聚合物-分析物结合行为。这种策略不是作为一种纠正机制,而是用于以统计上连贯和化学上有意义的方式扩展实验条件的表示范围,最终支持数据驱动的建模和分析。根据每种纳米聚合物系统的特点,应用了两种不同的增强技术:高斯采样和基于插值的重采样[45, 46]。对于结合能力测量显示出较大实验变异性的AMP-imp-HEMAT和AMP-non-imp-HEMAT系统,采用了高斯采样方法。在每种情况下,通过引入以实验观察到的结合能力(Q,毫克/克)为中心的正态分布扰动来生成合成数据点,每个扰动都以实际测量的值为中心。这些扰动的标准差由AMP数据子集内的实证方差定义,确保引入的噪声幅度反映了真实的实验波动。这种方法保留了AMP结合谱的固有随机特性,保持了增强数据中的原始分布特性和实验真实性。相比之下,MA–imp-HEMAT和MA–non-imp-HEMAT系统的结合谱较为平滑,实验噪声相对较低,因此采用了基于插值的增强技术。在MA实验覆盖的连续pH值和分析物浓度范围内进行线性插值,以估计测量数据点之间的中间Q值。这种方法利用了MA结合数据中观察到的平滑趋势,增强了结合谱的密度,而没有引入虚假波动。所有插值值都被限制在实验观察到的pH值、分析物浓度和Q值的范围内,从而保持了化学合理性,避免了超出原始数据范围的外推。所有增强的数据点都标注了来源追踪,并在后续建模阶段进行了分层验证。采取了多种措施确保增强数据的真实性和可靠性。在增强之前,移除了任何Q ≤ 0毫克/克的原始数据点,因为它们是非物理的或由噪声引起的伪影,防止这样的虚假值生成合成数据。在增强过程中,两种方法都受到化学上可行的限制,以避免超出原始实验范围的外推:高斯采样的点保持在观察到的Q值范围内(以实际观察值为中心),插值点仅在测量的pH值和分析物浓度范围内计算。因此,没有任何增强数据点超出原始数据集的界限或违反已知的化学约束。如果任何合成点产生了非正的Q值(例如由于随机扰动),则立即丢弃以保持一致性。此外,所有增强数据点都清楚地标注了来源,以便在机器学习建模阶段进行来源追踪和分层验证。进行了K–S测试,将增强后的Q值分布与每个聚合物-分析物系统的原始实验数据分布进行比较。这种增强策略有助于构建更密集采样的结合谱,而无需额外的实验尝试,最终实现了成本效益高、可扩展且统计上稳健的数据建模。为了确保增强过程的方法论严谨性,应用了特定的约束。对于AMP数据集的高斯噪声添加,每个实验点的扰动标准差根据该数据子集内的实证方差进行了比例缩放,使合成噪声根植于实际的实验变异中。对于MA数据集应用的插值,由于我们在初步实验中观察到的结合能力曲线的单调递增特性,选择了线性插值。重要的是,所有插值值都被算法限制在实验观察到的Q值的最小和最大范围内,防止模型在物理上不现实的数据点上进行训练。据我们所知,这是首次在MIP结合实验中应用高斯和基于插值的增强技术,突显了我们方法的新颖性。通过在不增加额外实验室试验的情况下实现更密集采样且分布上更忠实的数据集,这种增强策略为接下来的机器学习建模提供了坚实的基础。
2.5 一个基于AI的增强型ML框架,用于预测印迹和非印迹纳米聚合物的结合谱
为了推进对选择性结合行为的预测理解,开发了一个基于AI的增强型ML框架,用于估计MA及其AMP在MIP和NIP HEMAT纳米聚合物上的Q(毫克/克)值。分别使用增强数据集对AMP-imp-HEMAT、AMP-non-imp-HEMAT、MA-imp-HEMAT和MA-non-imp-HEMAT聚合物系统进行了建模,策略性地扩展以反映实验测量中观察到的变异性。学习任务被构建为一个监督回归问题,其中ML模型被训练来捕捉Q值与输入变量(如分析物浓度,如适用的话,还有pH值)之间的定量关系。建模框架结合了四种不同的回归算法,这些算法因其方法论多样性和与数据集特征的相关性而被选中:支持向量回归(SVR)[47],它通过核变换捕捉高维空间中的非线性关系;高斯过程回归(GPR)[48],它概率性地建模功能分布,并适应具有固有不确定性的小数据集;多项式回归(degree=2)[49],作为参数拟合的低复杂度基线;以及CatBoost [50],这是一种高性能的梯度提升算法,适用于具有最小预处理的表格和结构化数据。这种模型组合能够全面探索数据集中的线性和非线性结构-性质关系。模型开发和验证使用Python(v3.10)进行,利用了scikit-learn和CatBoost库。每种算法都使用5折交叉验证进行评估,这种策略旨在减轻过拟合并提高泛化能力[51]。使用四种标准回归指标评估了模型性能。决定系数(R2)量化了模型所能解释的Q方差的百分比。R2在不同折叠时的标准差反映了模型在交叉验证过程中的稳定性和鲁棒性。平均绝对误差(MAE)提供了一个衡量预测误差平均大小的指标,而不考虑误差的方向。相比之下,均方根误差(RMSE)对较大误差的惩罚更为严重,因此对异常值更敏感。建模流程的执行重点在于鲁棒验证和公平比较。对于每种算法,都采用了5折交叉验证,并结合了特定于折叠的数据增强技术以确保验证的完整性。具体来说,原始实验数据集首先被分成五个部分。在每次交叉验证迭代中,数据增强(高斯噪声或插值,如第2.4节所述)仅应用于该折叠的训练集,而验证集则完全由原始的、未增强的实验测量值组成。这确保了从任何原始实验条件派生的增强数据点永远不会出现在验证折叠中,从而防止数据泄露并保持验证指标的独立性。需要注意的是,在这项初步的可行性研究中,使用了scikit-learn和CatBoost库的默认超参数,没有进行广泛的调整。这种保守的方法是为了评估每种算法捕捉底层数据结构的内在能力,提供性能基线,而不会因超参数优化而出现过拟合的风险。本研究中报告的性能指标——R2、MAE和RMSE——是通过对所有五个折叠计算得出的平均值和标准差,从而提供了一个稳定且可靠的模型泛化能力的估计。这个基于人工智能的机器学习框架有效地补充了实验方法,使得能够高保真地预测不同材料系统中的结合行为。合成数据生成、系统模型比较和严格验证的整合,为先进聚合物分离技术中的数据驱动设计提供了一种可扩展、可解释和可转移的计算策略。
3 结果与讨论
前几节描述的实验和计算方法旨在系统地评估印迹和非印迹纳米聚合物对MA和AMP的结合行为。通过将分子印迹技术与基于机器学习的建模相结合,并辅以统计验证的数据增强策略,我们建立了一个混合框架,用于预测在不同物理化学条件下的纳米聚合物-分析物相互作用。以下部分展示了光谱特性分析、形态评估、结合性能分析、可重复性评估、数据增强结果以及结合能力的预测建模的结果。这些发现共同提供了关于印迹效率、目标选择性以及所提出方法在基于聚合物的纯化和分离过程中的更广泛应用性的见解。
3.1 MA-Imp-HEMAT和AMP-Imp-HEMAT纳米聚合物的特性
3.1.1 FTIR分析
使用FTIR研究了从聚合过程中获得的MA-imp-HEMAT和AMP-imp-HEMAT纳米聚合物的体相结构及其功能基团的存在情况。FTIR光谱及其相应的解释包含在支持信息中(图S1–S5)。
3.1.2 Zeta电位-粒径测量
对MA-imp-HEMAT和AMP-imp-HEMAT纳米聚合物进行了Zeta电位和粒径分析,以确定颗粒之间的相互作用以及颗粒的大小和分布。详细的描述和相关插图见支持信息(图S6)。
3.1.3 使用SEM和AFM的形态分析
使用扫描电子显微镜(SEM)确定了MA-imp-HEMAT和AMP-imp-HEMAT纳米聚合物的表面形态和体相特性。不同放大倍数(10,000×、25,000×和50,000×)的SEM图像显示,这些颗粒呈球形,且它们的大小是一致的。纳米聚合物的表面形态得到了确认,证实它们确实具有球形(图1)。图1显示了(A)AMP-imp-HEMAT、(B)MA-imp-HEMAT和(C)HEMAT样品在不同放大倍数下的SEM图像:上排10,000×,中间排25,000×,下排50,000×。刻度尺分别对应2微米、1微米和100纳米。此外,还使用AFM检查了纳米聚合物的表面形貌,其图像见图2。MA-imp-HEMAT和AMP-imp-HEMAT纳米聚合物都表现出粗糙的表面形貌,这与它们的纳米聚合物性质相符。MA-imp-HEMAT的均方根粗糙度(Rq)值为9.7纳米,而AMP-imp-HEMAT的Rq值为5.5纳米,表明MA-imp-HEMAT纳米聚合物相对更粗糙。这些粗糙度值有助于理解纳米聚合物与其模板分子之间的相互作用以及它们的结合和脱附过程。观察到的表面特性也支持了MA和AMP在纳米聚合物上的成功合成和印迹。
3.2 MA-Imp-HEMAT和AMP-Imp-HEMAT纳米聚合物的结合研究
进行了结合研究和优化,以确定设计纳米聚合物每个单元的分析能力。所有实验均重复三次(n=3)。详细的分析和相关的图形表示见支持信息(图S7)。本研究中使用的紫外分光光度法遵循了文献[52]中的既定协议,并利用标准溶液导出的校准方程来计算结合能力(Q)。
3.3 pH值对MA和AMP结合的影响
在聚合过程中设计的模板-单体相互作用旨在促进包括氢键和静电相互作用在内的次级力,从而实现MA和AMP对结构相似类似物的选择性识别。由于这些次级结合可以直接受到pH值变化的影响,因此研究了pH值对结合的影响。为此,使用了浓度为10 mM的缓冲溶液,在不同的pH水平(pH 6–8: 磷酸盐,pH 9: TRIS,pH 10: 钠)下进行实验,并在室温下进行。最终体积设定为1.0 mL,MA和AMP的初始浓度均为1.0 mg/mL。向这些溶液中加入10 mg的纳米聚合物,并使用连续搅拌方法进行2小时的结合。对于每个pH值,使用下面的公式计算纳米聚合物吸附的MA和AMP的量,并将结果绘制成图表以确定最佳pH值。如图3所示,当pH值从8.0增加到9.0时,MA和AMP的结合能力显著增加。使用Tris缓冲液时,MA和AMP的最大结合量分别为274 mg/g和282 mg/g。
3.4 初始浓度对MA和AMP结合的影响
通过系统地改变结合介质中MA和AMP的初始浓度(在0.25至1.0 mg/mL之间)来研究初始浓度对它们结合的影响。最终体积设定为1 mL,并使用pH 9.0 Tris缓冲液中的1 mg/mL MA和AMP标准溶液进行适当稀释。然后加入10 mg的纳米聚合物,并使用连续结合方法进行2小时的结合。在浓度研究中观察到,MIP纳米聚合物的结合能力优于NIP纳米聚合物(图4)。对于图4,使用了FTIR分析中显示出最高C-H和H键相关峰的M3和A3聚合物配方(图S4和S5),分别对应MA-imp-HEMAT和AMP-imp-HEMAT。
3.4.1 初始浓度对MA结合的影响
在pH 9.0 Tris缓冲液中,MA-imp-HEMAT纳米聚合物的结合能力较高(图A)。这与功能单体的增加使用有关,导致形成了更多针对MA的结合位点。随着溶液中MA浓度的增加,每个纳米聚合物质量单位吸附的MA量也呈线性增加,最终达到平衡。此时,吸附的MA量约为聚合物质量的11倍。同样,对于AMP结合,AMP-imp-HEMAT纳米聚合物也表现出显著更高的结合能力(图B)。这归因于功能单体的增加使用,这些单体为AMP生成了额外的结合位点。随着溶液中AMP浓度的增加,每个纳米聚合物质量单位吸附的AMP量稳步增加,直到达到平衡。在pH 9.0 Tris缓冲液中,结合能力约为其他pH值的两倍。
3.4.2 初始浓度对AMP结合的影响
初始浓度对MA和AMP结合的影响通过系统地改变它们在结合介质中的浓度来研究。最终体积设定为1 mL,并使用pH 9.0 Tris缓冲液中的1 mg/mL MA和AMP标准溶液进行适当稀释。然后加入10 mg的纳米聚合物,并使用连续结合方法进行2小时的结合。在浓度研究中观察到,MIP纳米聚合物的结合能力优于NIP纳米聚合物(图4)。对于图4,分别使用了FTIR分析中显示出最高C-H和H键相关峰的M3和A3聚合物配方。
3.4.3 特异性和选择性研究
文献中已经明确指出,在使用传统方法合成甲基苯丙胺(MA)和安非他明(AMP)的过程中会形成各种副产品[14, 17, 55]。这些副产品的存在显著降低了最终甲基苯丙胺产品的纯度,需要额外的纯化步骤。然而,这些额外过程通常成本高昂、耗时较长,并延长了整个合成工作流程的时间。作为替代方案,可以使用基于MIP的材料来解决这些挑战[56]。分子印迹聚合物(MIPs)具有高分子选择性,能够有效分离甲基苯丙胺(methamphetamine)和结构相似的苯丙胺类副产品。这种方法无需进行复杂的后合成纯化步骤,即可生产高纯度的甲基苯丙胺,从而降低了运营成本和处理时间。在水溶液中的结合研究优化后,研究了MA-imp-HEMAT和AMP-imp-HEMAT纳米聚合物的选择性。为此,选择AMP作为MA-imp-HEMAT纳米聚合物的竞争性分析物,选择MA作为AMP-imp-HEMAT纳米聚合物的竞争性分析物。将选定的分析物水溶液(每种浓度均为1.0 mg/mL)分别与MA和AMP印迹纳米聚合物共孵育1小时,以评估其选择性结合性能(图5)。
图5:使用MA-imp-HEMAT和AMP-imp-HEMAT对AMP和MA的交叉选择性研究。MA-imp-HEMAT和AMP-imp-HEMAT纳米聚合物的高选择性归因于在分子印迹过程中形成的特殊结合位点。这些印迹腔体专门设计用于与MA和AMP分子相互作用,从而表现出对这些分析物的高亲和力。在MA-imp-HEMAT纳米聚合物的情况下,观察到在AMP存在下的干扰信号非常低(相对Q值:1.27%),表明该MIP设计为仅与MA结合,非特异性相互作用最小。同样,当存在MA时,AMP-imp-HEMAT纳米聚合物也表现出低干扰(相对Q值:2.46%),显示出其对AMP的特异性。通过比率分析定量评估了印迹聚合物的选择性,其中MIP对其 target 分析物的结合能力(Q,mg/g)除以其对非 target 分析物的结合能力。该比率提供了聚合物区分结构相似化合物能力的数值度量。比率分析显示两个系统都具有高选择性,MA-imp-HEMAT对MA的偏好约为79倍,而AMP-imp-HEMAT对MA的偏好约为41倍。这些结果证实了目标特异性腔体的成功印迹,即使存在结构相似性也能实现精确的分子识别。疏水相互作用在纳米聚合物的选择性中起着重要作用。包含疏水单体(如功能单体)可增强MIP与目标分析物之间的相互作用,同时最小化非目标分子的结合。MA和AMP的疏水性质进一步增强了与MIP的相互作用,提高了这些特定分子的选择性。此外,纳米聚合物基质中的立体效应也有助于选择性。在分子印迹过程中形成的腔体设计为与目标分子MA和AMP的大小和形状相匹配,只允许这些分子有效结合,同时防止非目标分子干扰。纳米聚合物与分析物之间的相互作用通常是次要的疏水相互作用。本研究确定,分析物与两种合成的分子印迹聚合物(MA-imp-HEMAT和AMP-imp-HEMAT)之间的相互作用主要是疏水性质的。尽管没有专门针对MIPs用于纯化和分离目的的研究,但现有研究主要集中在AMP和MA的提取和检测上。我们开发的材料不仅适用于纯化和分离,还可以有效地用于提取和传感器应用。一些研究探索了使用MIPs提取MA和AMP。其中一项研究开发了一种带有内部吸附陷阱的提取针头用于MA和AMP的检测。在不锈钢针头的内表面涂覆了选择性针对MA的MIP层,提高了分析物的富集效果。该系统的提取能力为49.5 μmol/g,显示出良好的选择性和灵敏度[57]。另一项研究开发了一种基于MIP的固相微萃取(SPME)方法用于提取和检测MA及其衍生物[58]。这种使用甲基丙烯酸和丙烯酰胺制成的MIP以MA为模板,形成了整体纤维。当与气相色谱-质谱(GC–MS)结合时,该纤维实现了有效的提取、预浓缩和分析MA,并在优化聚合和提取过程后提高了选择性。结果显示出高精度,相对标准偏差(RSD%)介于1.20%到3.61%之间。另一份报告专注于创建一种具有磺酸基团的对手性选择性的树脂材料,用于(±)-甲基苯丙胺的手性分离。合成了R-甲基苯丙胺-磺酰胺酚类衍生物,并与酚和甲醛聚合,生成了一种去除R-甲基苯丙胺对映异构体的材料。结合测试显示其结合能力为233 ± 1 mg/g [58]。我们的研究表明MA和AMP之间具有高选择性和分离效率,Q值分别为1039 mg/g(MA)和967 mg/g(AMP),从而实现了高纯度的精确分离。基于MIP的纳米聚合物表现出强烈的结合亲和力和优异的物理化学稳定性,特别是在宽广的pH范围内,这通常是类似系统中的一个限制因素。基于MIP的纳米聚合物表现出强的结合亲和力和出色的稳定性,使其适用于需要高纯度输出的应用。这使得我们的平台更适合实际应用,尤其是在复杂样品基质中。此外,该方法在合成简便性、成本效益和可扩展性方面具有显著优势,增强了其在分析和制备分离工作流程中的潜在应用价值。为了进一步说明合成的MA-imp-HEMAT和AMP-IMP-HEMAT纳米聚合物的性能,与文献中报告的现有分子印迹聚合物(MIPs)进行了定量比较(表1)。虽然以前的研究成功地开发了主要用于从生物或环境基质中分析检测和微提取苯丙胺类刺激物的基于MIP的提取系统,但这些系统通常报告较低的结合能力,并且往往缺乏关于操作寿命的全面数据。
表1:甲基苯丙胺和苯丙胺提取的MIP性能的定量比较。
研究发现:
- 目标分析物:MA/AMP
- 结合能力:1039 mg/g(MA);967 mg/g(AMP)
- 选择性比:约79倍(MA相对于AMP);约41倍(AMP相对于MA)
- 5次循环后的脱附率保持在95%以上
表1中的数据表明,本研究开发的纳米聚合物表现出异常高的结合能力(MA为1039 mg/g,AMP为967 mg/g),远超传统基于MIP的固相提取材料。此外,比率分析显示了对MA和AMP的出色选择性,分别为约79倍和约41倍。这突显了印迹过程中创建的分子腔体的高保真度。结合高度可靠的重复使用性——在五个连续循环中保持超过95%的脱附效率——这些比较指标清楚地说明了所提出平台的优越性。因此,该系统弥合了小规模分析提取和高产量纯化之间的差距,非常适合制药级生产的严格要求。
3.6 从MIP中去除模板及重复使用性研究
图6展示了MA-imp-HEMAT和AMP-IMP-HEMAT纳米聚合物的结合-脱附循环。在至少重复五次的纳米聚合物结合研究中,脱附率始终保持在95%以上。尽管脱附率很高,但未观察到MA和AMP的结合显著下降。由于纳米聚合物的表面积较大,结合-脱附循环发生得很快。
3.7 增强数据驱动的Q值建模
数据增强技术的应用产生了统计上丰富且化学上连贯的数据集,扩展了原始实验测量的表示深度。作为增强过程的直接结果,最初由有限的pH值和分析物浓度点定义的结合曲线被扩展到更广泛、更连续的参数空间。在AMP-imp-HEMAT和AMP-non-imp-HEMAT系统中,高斯采样在每个实验条件周围引入了受控的变化,产生了保留了实验室重复实验中观察到的方差模式的Q值分布。这增强了内在实验噪声的表示,并允许后续模型超越单点测量进行泛化。对于MA-imp-HEMAT和MA-non-IMP-HEMAT系统,基于插值的增强有助于在采样稀疏区域估计中间Q值。虽然结果分布的方差低于高斯增强系统,但它们成功保留了Q值在pH和浓度梯度上的结构趋势。MA-imp-HEMAT系统表现得尤为明显;尽管标准差降低,但插值值支持了预测建模,表明所需的关键信号模式得到了保留。为了评估增强数据集的统计一致性,对每个系统进行了K-S检验。表2展示了K-S检验结果以及原始和合成Q值的均值和标准差。在高斯增强系统中,合成均值偏离不到0.015 mg/g,标准差保持在原始值的0.1单位以内。相应的p值(>0.99)表明原始分布和增强分布之间存在 strong 重叠。在基于插值的系统中,方差有所减少,但均值保持稳定,p值保持在0.65以上,支持了分布的兼容性。
3.8 基于机器学习的结合性能建模
为了评估增强数据集的预测能力,实现了四个监督回归模型:SVR、GPR、多项式回归(度数=2)和CatBoost。每个模型都使用5折交叉验证进行了评估,以确保报告的指标代表了普遍的泛化性能。在AMP-imp-HEMAT数据集上测试的模型中,基于集成的CatBoost回归取得了最高的预测性能,平均R2为0.9923,标准差为0.0021。该模型还显示出最低的平均绝对误差(MAE=0.1800)和均方根误差(RMSE=0.2376),表明预测值和实验值之间有很高的一致性。GPR紧随其后,准确度相当(R2=0.9921),表明基于核的模型非常适合捕捉聚合物-分析物结合行为中的非线性。SVR的表现也相当强(R2=0.9888),尽管预测误差略有增加。相比之下,二次多项式回归的表现较差(R2=0.8219),误差范围较大(MAE=0.9254,RMSE=1.1641),表明其在捕捉复杂相互作用方面的灵活性不足。表3展示了AMP-imp-HEMAT系统的回归性能指标。
总之,这些结果验证了增强数据的可靠性。高斯采样保留了实验重复的随机特性,而插值扩展了未测量条件下的表示连续性。这些数据集构成了下一节描述的机器学习建模的基础。实现了四个监督回归模型来评估增强数据集的预测能力,结果性能指标提供了模型泛化能力的稳健估计。SVR获得了最高的设计空间R2值0.8946(±0.0327),以及最低的均方根误差(RMSE)0.1610和平均绝对误差(MAE)0.1236,表明其在建模非印迹系统时的稳健性,其中结合相互作用往往选择性较低且更为分散。CatBoost的表现几乎相同(R2=0.8924),紧随其后的是GPR和多项式回归。值得注意的是,GPR在不同折叠中的变异性较大(R2标准差=0.0804),这可能反映了数据集中由于结合特异性降低而导致的局部不一致性。尽管多项式回归的灵活性较低,但仍保持了可接受的拟合度(R2=0.8560),证明了即使简单的模型也能从增强的非印迹聚合物(NIP)数据中提取出有意义的结构。表4显示了AMP-非印迹-HEMAT系统的回归性能指标(5折交叉验证)。
MA-印迹-HEMAT系统在所有评估的数据集中显示出了最高的预测准确性,如表5所示。CatBoost再次成为表现最佳的模型,实现了接近完美的平均R2值0.9979,方差极小(±0.0002),同时具有非常低的MAE(0.0681)和RMSE(0.1084)。这些结果反映了该模型在即使面对插值数据时,也能很好地泛化MA在印迹纳米聚合物表面的结合行为。SVR也表现良好(R2=0.9832),尽管其误差范围明显高于CatBoost。多项式回归(-degree=2)显示出中等的准确性(R2=0.8778),表明虽然它可以捕捉到总体趋势,但缺乏高精度建模MA-印迹-HEMAT结合所需的复杂性。有趣的是,GPR在这个数据集上未能有效收敛,返回了一个负的R2分数(-2.5953)和非常高的误差值。这种偏差表明GPR的假设和核配置不适合插值后的MA-印迹-HEMAT数据的潜在结构,可能是由于过度平滑或特定数据区域缺乏可泛化模式。
GPR在MA系统上的表现严重失败(R2值为负),而在AMP系统上表现优异(R2>0.86),这揭示了GPR的概率框架与用于MA数据的基于插值的增强策略之间存在根本的不兼容性。与用于AMP系统的高斯噪声增强不同——后者保留了GPR用于不确定性估计的随机变异性——线性插值引入了具有抑制局部方差的确定性合成点。这种方差不匹配阻止了GPR在训练期间正确校准其核函数,导致在保留的实验数据上泛化能力较差。相比之下,基于树的模型和SVR不依赖于方差估计,因此对插值数据结构保持稳健。这一观察强调了匹配增强策略与模型架构的重要性:概率模型需要保持方差的增强方法,而确定性模型则可以容忍减少方差的插值。在MA-非印迹-HEMAT系统中,CatBoost再次展示了出色的预测准确性,平均R2值为0.9942,变异最小(±0.0018)。它还获得了最低的MAE(0.0069)和RMSE(0.0088),即使在非印迹聚合物这种结构选择性较低的条件下也证明了其稳健性。多项式回归(degree=2)也表现良好(R2=0.8435),表明pH值、浓度和Q值之间的通用关系仍然足够结构化,可以被二次多项式项捕捉到。然而,SVR的表现有所下降(R2=0.6766),GPR再次表现不佳,产生了负的R2值(-9.3250)和高的误差指标。
3. 人工智能驱动的设计空间模拟用于工艺相关参数优化
为了评估所开发的机器学习框架在实验受限条件下的工艺级适用性,针对MA-印迹-HEMAT系统表现最佳的模型CatBoost(R2>0.99)被用来进行人工智能驱动的设计空间模拟,以预测结合行为。由于使用受控物质进行广泛实验优化的监管、物流和成本限制,该策略被作为一个补充的计算层来指导参数优先级排序,而不是替代湿实验室实验。在实验可访问的范围内,生成了一个高分辨率的预测表面,涵盖了连续的pH值和MA浓度值。这种方法将模型从一个回顾性的数据拟合工具转变为一个前向的工艺导向模拟器,能够探索可行的操作窗口。结果产生的设计空间图(见图7)展示了物理化学参数与吸附能力(Q,mg/g)之间的关系,并叠加了实验和增强数据点以供参考。图7显示了使用CatBoost模型对MA-印迹-HEMAT纳米聚合物上的MA结合行为进行的人工智能驱动的设计空间模拟。模拟表面识别出一个结合性能增强的明确定义区域(Q>1000 mg/g),该区域集中在pH=9.0和MA浓度高于1.25 mg/mL。重要的是,这个区域与pH值和浓度依赖的结合实验中观察到的离散趋势完全一致(见图3和图4),支持了模型的内部一致性和物理合理性。表面上的平滑过渡进一步表明了插值主导的行为,增强了其在受限实验条件下进行设计空间探索的适用性。除了与现有测量结果一致之外,人工智能驱动的模拟还通过缩小对工艺规划有意义的参数空间,提供了对未测试但化学上可行的条件的可操作性见解。在这个背景下,模型充当了一个工程决策支持替代品,使得目标明确的实验验证成为可能,减少了材料消耗,并为可扩展的纯化策略提供了信息。该框架不是为了断言绝对优化,而是促进了合理的参数选择,加速了开发周期,同时保持了监管和资源效率。
4. 结论
本研究建立了一个混合实验-计算框架,用于使用分子印迹纳米聚合物结合人工智能辅助建模来选择性地识别和分离甲基苯丙胺(MA)及其主要代谢物安非他明(AMP)。通过批量聚合,成功地合成了高度选择性的MA-印迹-HEMAT和AMP-印迹-HEMAT纳米结构,并展示了卓越的结合性能,最大吸附能力分别达到MA的1039 mg/g和AMP的967 mg/g。这两种系统都对结构相似的干扰物具有很强的选择性,并且在五个连续的结合-解吸循环中保持了超过95%的初始结合能力,突显了它们的稳健性和可重复性。为了克服与受控物质广泛实验优化相关的实际限制,结合了统计验证的数据增强策略,以资源高效的方式扩展了实验设计空间。增强后的数据集使得多个监督机器学习模型的稳健训练和比较评估成为可能。在这些模型中,CatBoost成为MA-印迹-HEMAT和MA-非印迹-HEMAT系统最准确和稳定的预测器(R2分别为0.9979和0.9942),而CatBoost和GPR在AMP-印迹-HEMAT系统上也表现出相似的高性能(R2约为0.992)。SVR在AMP-非印迹-HEMAT系统上展示了更好的泛化能力(R2=0.8946),强调了算法-系统兼容性在数据驱动的结合分析中的重要性。除了预测准确性之外,人工智能驱动的设计空间模拟通过优先考虑在监管和材料约束下的可行操作窗口,实现了工艺相关的参数优化。该框架减少了对经验性试错实验的依赖,提供了针对目标实验验证的可操作性指导,并为可扩展的工艺规划提供了信息。与通常受溶剂消耗、通量限制和操作成本制约的传统色谱纯化方法不同,所提出的基于MIP的平台——由人工智能辅助的参数优化支持——提供了一个模块化且资源高效的替代方案,适用于连续或半连续处理方案。因此,这项研究将分子印迹的应用范围扩展到了与药品级生产和工业过程控制相关的工艺导向纯化策略。
我们非常感谢土耳其科学技术研究委员会(TÜBİTAK)对我们项目(项目编号123Z096)提供的财政支持。