综述:机器学习如何助力抗击抗菌素耐药性:AMP分析与生成方法综述

时间:2025年4月16日
来源:International Journal of Peptide Research and Therapeutics

编辑推荐:

这篇综述系统探讨了机器学习(ML)和深度学习(DL)在抗菌肽(AMP)预测与生成中的关键作用,揭示了其通过处理复杂生物数据加速药物发现的潜力,同时指出数据稀缺和模型假阳性(如随机序列被误判为AMP的概率达0.5–100%)等挑战,强调需结合实验验证提升模型可靠性。

广告
   X   

抗菌肽(AMP)作为对抗抗菌素耐药性(AMR)的新兴武器,凭借其独特的膜破坏机制和低耐药性风险,成为研究热点。然而,传统实验方法耗时耗力,难以应对大规模肽库筛选需求。机器学习(ML)和深度学习(DL)的引入,为AMP的高通量预测与设计提供了革命性工具。

背景

AMP通过物理破坏微生物细胞膜或干扰代谢通路发挥杀菌作用,其多靶点特性显著降低耐药性发展概率。但实验验证AMP需经历繁琐的合成与活性测试,成本高昂。计算生物学方法应运而生,ML/DL模型通过分析序列-活性关系,实现了AMP的快速虚拟筛选。

目标与方法

本研究旨在评估现有AMP预测模型的效能与局限。研究者生成随机20氨基酸肽序列,输入多个训练好的ML模型(如神经网络)进行AMP分类测试,以检验模型鲁棒性。

结果与挑战

ML模型(尤其是深度神经网络)展现出强大的模式识别能力,可预测新分子的生物活性。然而,两大瓶颈凸显:一是高质量实验验证数据集稀缺,导致模型训练不足;二是假阳性率高,随机序列被误判为AMP的比例从0.5%至100%不等,暴露了过拟合和泛化性差的缺陷。例如,某些模型对无意义序列仍输出高置信度AMP分类,提示特征提取可能存在偏差。

未来方向

提升模型性能需三管齐下:扩充经实验验证的AMP数据集、整合肽的3D结构(如α螺旋/β折叠)与功能域信息优化算法、建立ML预测与湿实验验证的闭环反馈机制。唯有计算与实验双轨并行,才能释放AMP在抗击AMR中的全部潜力。

(注:全文严格基于原文内容缩编,未添加非原文信息。)

生物通微信公众号
微信
新浪微博


生物通 版权所有