在日益严峻的全球健康危机——抗菌药物耐药性(AMR)面前,传统抗生素的效力正被以ESKAPE病原体(粪肠球菌、金黄色葡萄球菌、肺炎克雷伯菌、鲍曼不动杆菌、铜绿假单胞菌和肠杆菌属)为代表的多重耐药细菌以及新兴的耐药真菌(如耳念珠菌)迅速侵蚀。面对这一紧迫挑战,抗菌肽(AMPs)因其独特的膜靶向作用机制和较低诱导耐药性的风险,被视为一种前景广阔的替代策略。然而,毒性、不稳定性及生产限制等因素长期阻碍了其临床转化。近年来,人工智能(AI)技术的突破正在重塑这一领域,为加速下一代抗菌肽的研发带来了革命性工具。
人工智能在抗菌肽发现与优化中的应用
人工智能,特别是机器学习(ML)和深度学习(DL),正通过数据驱动的方式,以前所未有的规模探索肽序列与活性之间的复杂关系。其核心在于从已知的抗菌肽与非抗菌肽数据中学习模式,以预测候选肽的生物活性、安全性和其他相关性质,从而指导实验验证前的迭代设计循环。
机器学习预测:传统的ML方法,如支持向量机(SVM)、随机森林(RF)和极端梯度提升(XGBoost),依赖于手工设计的特征提取,如净电荷、疏水性、二级结构倾向和氨基酸组成模式(k-mer)。这些模型能够有效区分抗菌肽与非抗菌肽,并预测抗菌活性、溶血性等关键性质。例如,RF模型可揭示与抗菌活性最相关的理化决定因素,而XGBoost在多任务预测(如同时优化活性、毒性和稳定性)中展现出优异性能。
深度学习方法:DL模型,如卷积神经网络(CNN)、循环神经网络(RNN)/长短期记忆网络(LSTM)和基于Transformer的蛋白质语言模型,能够直接从原始肽序列中自动学习复杂模式和高阶上下文关系。CNN擅长识别与膜相互作用相关的局部序列基序,而LSTM可捕捉序列中的长程依赖关系。Transformer模型生成的上下文嵌入编码了丰富的生化和结构信息,在预测最小抑菌浓度(MIC)和溶血效应方面表现出色,已成为序列分析和新肽生成设计的基石。此外,整合序列编码与AlphaFold等工具预测的结构信息的混合模型,能更全面地反映肽的功能,从而提升预测准确性。
生成式AI与肽设计:生成式AI实现了从“预测”到“创造”的跨越。生成对抗网络(GAN)、变分自编码器(VAE)和扩散模型是用于从头设计新型抗菌肽的主要架构。这些模型从大型肽数据集中学习统计模式,能够在满足多目标约束(如高效抗菌、低毒、高稳定性)的前提下,探索广阔的未知序列空间。扩散模型因其能生成高度多样且结构一致的序列,成为该领域的前沿方法。强化学习(RL)则为多目标优化提供了互补策略,其智能体根据来自预测模型(如活性、毒性评估器)的“奖励”信号,不断调整策略以生成最优肽序列,从而高效地探索序列景观。
结构与作用机制预测:结构决定功能。AlphaFold和Rosetta等工具极大地提高了肽结构预测的精度,有助于识别与膜破坏相关的两亲性螺旋、聚集倾向区域等。新兴的AI驱动膜相互作用预测工具,能模拟肽与脂质双层的结合亲和力、穿透深度和破坏潜能,为理解其抗菌特异性(如区分革兰氏阳性与阴性细菌膜、真菌膜)提供了关键机制见解。这对早期筛选和优化至关重要。
针对ESKAPE病原体和耐药真菌的靶向策略
ESKAPE病原体和多重耐药真菌(如耳念珠菌)因其复杂的耐药机制和生物膜形成能力,构成了巨大的治疗挑战。人工智能为开发针对这些“高优先级”病原体的特异性抗菌肽策略开辟了新路。
对抗ESKAPE病原体:ESKAPE病原体通过表面修饰、外排泵、靶点改变、酶降解(如蛋白酶)以及强大的生物膜形成等机制对抗菌肽产生耐药。生物膜由胞外聚合物基质包裹,能显著增强病原体对治疗的耐受性,是医疗器械相关感染的核心问题。AI模型可通过整合病原体特异性数据(如膜脂组成、生物膜基质成分)来设计能穿透或破坏生物膜的抗菌肽。已有研究利用机器学习分类器识别与抗生物膜活性相关的序列特征,并生成具有此特性的新肽。尽管临床转化成功的抗菌肽(如多粘菌素、达托霉素、pexiganan)数量有限,但它们证明了基于肽的抗菌策略的可行性。AI加速的优化有望带来更多针对此类“顽固”病原体的有效候选药物。
对抗多重耐药真菌:以耳念珠菌(C. auris)为代表的多重耐药真菌威胁日益严重。与细菌膜不同,真菌膜富含麦角固醇和糖鞘脂,外部包裹着坚固的细胞壁,这影响了抗菌肽/抗真菌肽(AFPs)的作用方式。AI/ML方法正被用于从海量数据中挖掘和优化具有抗真菌活性的肽序列。研究发现,抗菌肽如cathelicidin LL-37,不仅能通过膜破坏(增加通透性、诱发氧化应激)作用于耳念珠菌,还能导致其线粒体功能障碍、DNA合成抑制,具有较低的耐药性发展倾向。人工智能通过分析真菌膜特异性靶点(如麦角固醇)和宿主毒性之间的平衡,能够指导设计出选择性更高、更安全的抗真菌肽。
克服临床转化瓶颈:ADMET预测与递送策略
从实验室到临床,抗菌肽面临着吸收、分布、代谢、排泄和毒性(ADMET)以及稳定性方面的多重障碍。AI正在系统性地预测和优化这些关键药学性质。
ADMET与稳定性预测:
- •
溶血性预测:AI模型通过分析电荷分布、疏水性矩等特征,能够高精度地预测肽的溶血潜力,从而在设计早期剔除高风险序列。
- •
蛋白酶稳定性模型:可预测肽链在血清中的易切割位点,指导通过D-型氨基酸取代、环化等化学修饰来增强抗蛋白酶降解能力。
- •
聚集与溶解性预测:通过分析疏水斑块、电荷平衡等特征,AI工具可评估肽的自聚集倾向和溶解性,指导序列优化以改善其成药性和大规模生产的可行性。有趣的是,可控的淀粉样原性或聚集倾向也可能被设计为一种抗菌机制,用以破坏病原体的必需蛋白。
递送系统与处方策略:为增强体内稳定性、延长半衰期并提高生物利用度,多种处方策略被开发出来,AI在其中扮演了优化角色。
- •
纳米载体:壳聚糖纳米粒、脂质体和聚乙二醇化(PEGylation)是常用的递送系统。壳聚糖因其良好的生物相容性和黏膜粘附性受到关注;脂质体可实现亲疏水药物的高效包载;PEG化能“隐形”肽分子,减少免疫识别和蛋白酶攻击,延长循环时间。
- •
化学修饰:环化(如头尾环化)可消除末端外切蛋白酶的切割位点,增强稳定性并可能提高活性。D-型氨基酸替代可显著提高肽对蛋白酶的抵抗力,但需平衡其对活性和免疫原性的潜在影响。
AI辅助处方优化:AI不仅设计肽序列,还能优化其递送。机器学习模型可用于预测特定肽与不同纳米载体(如脂质体组成、PEG链长)的兼容性,从而实现“个体化”处方设计,在活性、稳定性和安全性之间找到最佳平衡。
制造挑战与未来方向
抗菌肽的临床转化还面临制造成本高昂和规模化生产复杂的瓶颈。AI通过预测可制造性(如合成难度、纯化收率)和优化生产流程,有望显著降低成本。例如,AI模型可优先选择易于化学合成或重组表达的序列。在监管方面,AI工具可协助进行更全面的免疫原性风险评估(如T细胞表位预测),以满足药物审评要求。
展望未来,AI驱动的抗菌肽研发将朝着更整合化和临床导向的方向发展。关键方向包括:
- 1.
开发集成连续学习的AI框架,结合医院药敏谱等实时临床数据,动态优化针对当地流行耐药菌的抗菌肽设计。
- 2.
深化多目标优化,在活性、毒性、稳定性之外,更系统地纳入药学性质、制造成本和免疫调节特性。
- 3.
推进病原体导向的精准设计,利用AI整合不同病原体(如特定ESKAPE菌株、耳念珠菌克隆系)的特异性耐药机制和膜生物学数据,设计“精准打击”的抗菌肽,而非广谱药物。
- 4.
探索大型语言模型在假设生成和实验设计中的潜力,并与结构建模、定量预测框架结合,形成更强大的决策支持系统。
尽管AI模型仍受限于训练数据的质量和标准化程度,且从计算机预测到体内疗效的路径上充满挑战,但它无疑已成为抗菌肽从发现到临床转化道路上不可或缺的加速器和导航仪。通过深度融合计算智能、微生物学与生物医学,AI赋能的抗菌肽研发有望为对抗不断升级的抗菌药物耐药性危机提供突破性的解决方案。