1. 引言
药物研发过程耗时漫长、成本高昂且失败率高,约90%的候选药物在I期临床试验阶段即遭淘汰。传统计算方法在应对复杂多目标分子优化方面存在局限,而人工智能(AI)技术的兴起为加速药物发现提供了新范式。深度学习(DL)方法在生成建模和分子性质预测方面展现出强大潜力,能够设计具有定制药理学特征的化合物,有望系统探索可合成分子的巨大化学空间,改变药物研发格局。
2. 数据、描述符与评估策略
AI驱动药物发现的基础是高质量的数据。ChEMBL、PubChem、ZINC等公共数据库提供了数百万标注化合物信息,而LIT-PCBA等精选数据集则为模型训练和评估提供了更接近真实高通量筛选(HTS)环境的基准。分子描述符是将化学信息转化为计算机可处理数值的关键步骤,包括零维(0D) constitutional descriptors、一维(1D)如SMILES字符串和指纹(ECFP)、二维(2D)分子图以及三维(3D)空间描述符等。其中,SMILES和分子图因其有效性和易处理性成为最常用的表示方法。
模型评估至关重要。MoleculeNet和Chemprop等基准平台为分子性质预测模型提供了标准化评估流程。对于生成模型,评估指标涵盖化学有效性(validity)、多样性(diversity)、独特性(uniqueness)、新颖性(novelty)、类药性(QED)和合成可及性(SAS)等。GuacaMol和MOSES等基准框架则专门用于评估de novo分子生成算法,通过分布学习任务和目标导向基准来全面衡量模型性能。然而,需注意理论评估指标与实际应用价值之间可能存在差距,因此结合对接评估、湿实验反馈等互补策略尤为重要。
3. 深度学习模型演进
3.1. 循环神经网络(RNN)与长短期记忆网络(LSTM)
RNN及其变体LSTM、GRU擅长处理序列数据,早期被广泛应用于基于SMILES字符串的分子生成和性质预测。它们能够学习SMILES字符串中的字符依赖关系,逐步生成分子。通过迁移学习(TL)策略,模型可以在大规模化学空间学习后进行特定靶点或性质的微调,生成具有目标生物活性的分子。双向RNN(biRNN)等架构通过从序列两端捕获上下文,进一步提升了模型性能。
3.2. 卷积神经网络(CNN)
CNN最初用于图像处理,其局部连接和权值共享特性使其能够有效捕获分子中的局部子结构模式(如官能团、环系统)。在药物发现中,CNN被 adapted 用于处理2D分子图或3D体素化网格,用于性质预测和分子生成任务。1D CNN可用于处理蛋白质序列或SMILES,而3D CNN则能直接从配体-蛋白质复合物的空间原子排列中学习结合模式。
3.3. 变分自编码器(VAE)
VAE通过编码器-解码器框架将分子映射到连续潜空间,从而实现分子生成和优化。其核心优势在于潜空间的结构化特性,便于采样和属性插值。早期SMILES-based VAE存在生成无效分子的问题,后续研究通过引入语法约束(如GrammarVAE)或使用分子图作为输入(如JT-VAE, NeVAE)显著提高了生成分子的有效性。VAE框架支持条件生成,可针对特定性质(如结合亲和力、溶解度)进行优化。
3.4. 生成对抗网络(GAN)
GAN通过生成器和判别器的对抗训练学习真实数据分布,从而生成新颖的分子结构。例如,ORGANIC框架尝试优化特定理化性质。然而,GAN训练不稳定和模式崩溃问题限制了其应用。混合模型如VAE-GAN(如druGAN, LatentGAN)结合了VAE的结构化潜空间和GAN的生成质量,表现出更优性能。Graph-based GAN(如MolGAN)直接生成分子图,提高了化学有效性。
3.5. 图神经网络(GNN)
分子图是表示分子结构的自然方式,节点代表原子,边代表化学键。GNN及其变体(如图卷积网络GCN、图注意力网络GAT)能够直接操作于图结构,有效捕获拓扑信息和子结构特征。基于流的模型(Flow-based models)和扩散模型(Diffusion models)是图生成领域的新兴架构,前者通过可逆变换学习数据分布,后者通过逐步去噪过程生成分子,尤其在生成3D分子构象方面显示出潜力。知识图谱(KG)则能整合药物、靶点、疾病等多源异质生物医学数据,支持系统水平的药物重定位和副作用预测。
3.6. Transformer架构
Transformer的核心是自注意力(Self-Attention)机制,能有效捕获序列中的长程依赖关系。在药物发现中,Transformer被用于SMILES序列的预训练(如ChemBERTa, SMILES-BERT),随后微调用于性质预测,展现出强大性能。在生成方面,GPT风格的模型可用于de novo分子设计。Transformer还可用于蛋白质序列到分子结构的“翻译”任务,实现靶点导向的分子生成。将Transformer与VAE结合(如Transformer-VAE)或与强化学习(RL)结合,进一步提升了生成分子的可控性和多样性。
3.7. 强化学习(RL)
RL将分子生成视为序列决策过程(马尔可夫决策过程),智能体(Agent)通过与环境交互(通常指性质预测模型)并获得奖励(Reward)来学习优化策略。RL可与任何生成器架构(RNN, GNN, Transformer等)结合,直接针对多目标属性(如高QED、低毒性、强亲和力)进行优化。策略梯度方法、Actor-Critic算法(如A2C)以及Q-learning(如MolDQN)是常用的RL算法。PPO(近端策略优化)等技巧有助于稳定训练。RL在探索广阔化学空间和实现多目标优化方面具有独特优势。
3.8. 分子性质预测
分子性质预测是计算机辅助药物设计(CADD)的核心。从传统的定量构效关系(QSAR)模型到基于ML(SVM, RF)和DL的方法,预测精度不断提升。GNN和Transformer等DL架构能够直接从分子结构(图或序列)中自动学习特征表示,避免了手工设计描述符的局限性。对比学习(Contrastive Learning)等自监督学习策略利用大量未标注数据预训练模型,然后在少量标注数据上微调,有效缓解了标注数据稀缺问题。整合3D几何信息(如GEM方法)能进一步提升对依赖空间构象性质的预测能力。
4. AI驱动药物的临床转化与监管
4.1. 临床阶段AI生成小分子
多家AI原生公司(如Exscientia, Insilico Medicine, Relay Therapeutics, Nimbus Therapeutics)已将AI设计的小分子推进至临床试验阶段。例如,Insilico Medicine的INS018_055(TNIK抑制剂)用于特发性肺纤维化已进入II期临床试验;Exscientia的EVOEXS-21546(A2A受体拮抗剂)等分子也进入了临床研究。BMF-219(menin抑制剂)正在探索用于白血病和糖尿病治疗。这些案例初步证明了AI在加速先导化合物发现和优化方面的潜力。AI生成的分子通常在类药性、合成可及性等方面经过优化,可能具有更好的药代动力学性质或耐受性。药物重定位(Drug Repurposing)也是AI应用的重要方向,例如BioXcel Therapeutics将右美托咪定(Dexmedetomidine)重用于治疗与精神分裂症或双相情感障碍相关的激越。
4.2. 不断演变的监管框架
随着AI在药物研发中的应用日益增多,美国FDA、欧洲EMA等监管机构正在积极制定相关指南。FDA发布了讨论文件和草案指南,提出了基于风险的七步可信度评估框架,强调模型的透明度、可重复性、数据溯源和生命周期管理。EMA也发布了反思文件,呼吁申办方提供AI在各阶段应用的证据。中国NMPA、英国MHRA、加拿大Health Canada等机构也相继发布了相关指导原则或战略。监管框架的逐步明确对于建立对AI驱动药物发现的信任、促进其合规应用和最终获批至关重要。
5. 挑战与未来展望
尽管前景广阔,AI在药物发现中仍面临诸多挑战:数据质量、不一致性和可及性;模型“黑箱”特性导致的可解释性(Explainability)不足;蛋白质-配体相互作用建模,特别是对于缺乏3D结构信息的靶点;计算资源需求高昂;生成分子的合成可行性(Synthetic Accessibility)验证;以及将AI工具有效整合到现有药物研发工作流中的实践难题。此外,AI生成化合物的知识产权和监管政策仍需进一步明确。
未来,AI驱动药物发现的发展方向包括:开发更可解释、可泛化的模型;深度融合多模态数据(如组学数据、真实世界证据);建立集成了AI生成、自动化合成和活性测试的闭环反馈系统;关注协同药物组合的设计;以及加强学术界、工业界、医疗机构和监管机构之间的合作,共同推动这一领域的健康发展,最终实现为患者更快地提供更有效、更安全的新药。