人工智能驱动小分子药物研发:开启癌症免疫治疗精准化新时代 中文标题 人工智能赋能小分子精准癌症免疫调节治疗:从靶点发现到个性化药物设计

时间:2025年10月3日
来源:npj Drug Discovery

编辑推荐:

【编辑推荐】为解决癌症免疫治疗响应率低、耐药性强及生物制剂局限性等问题,研究人员开展人工智能驱动小分子免疫调节剂的开发研究。通过整合多组学数据、深度学习生成模型和强化学习优化策略,成功设计出靶向PD-1/PD-L1、IDO1、STING等关键免疫检查点的新型小分子抑制剂,证实AI平台能显著加速hit-to-lead进程并提高临床转化成功率,为个性化免疫治疗提供新范式。

广告
   X   

癌症免疫治疗通过激活人体免疫系统识别和杀伤肿瘤细胞,彻底改变了肿瘤治疗格局。然而,当前主流的生物制剂如PD-1/PD-L1单抗面临诸多挑战:免疫耐药机制导致疗效受限,肿瘤异质性导致患者响应差异,免疫相关不良事件引发安全性问题,且生物制剂存在生产成本高、组织渗透性差等局限性。这些瓶颈促使研究者将目光转向具有口服生物利用度高、化学可调性强、能靶向细胞内蛋白等优势的小分子免疫调节剂。
为加速小分子免疫治疗药物的开发,研究者开始整合人工智能技术应对传统药物研发周期长、成本高、失败率高的挑战。美国FDA现代化法案3.0的推出正式认可了器官芯片、计算建模和AI驱动方法作为临床前研究的替代方案,为AI在药物研发中的应用提供了政策支持。本研究系统阐述了AI如何变革精准癌症免疫调节治疗中的小分子开发策略,聚焦于免疫检查点、肿瘤微环境调控、抗原呈递和代谢通路等关键靶点。
研究人员采用多学科交叉方法,整合了机器学习(ML)、深度学习(DL)和自然语言处理(NLP)等人工智能技术。主要技术方法包括:1)基于多组学数据(基因组学、转录组学、蛋白组学)的生物靶点识别;2)使用生成对抗网络(GANs)和变分自编码器(VAEs)的从头分子设计;3)结合定量构效关系(QSAR)建模和结构基虚拟筛选的结合亲和力预测;4)采用联邦学习技术的多中心数据协作分析;5)基于数字孪生技术的患者特异性治疗模拟。
AI在药物发现中的基础
研究团队系统评估了多种AI技术在药物发现中的应用价值。监督学习算法如支持向量机(SVM)、随机森林和深度神经网络在定量构效关系建模、毒性预测和虚拟筛选中表现出色。无监督学习通过k均值聚类、层次聚类和主成分分析(PCA)识别新的化合物类别和分子特征间未知关系。强化学习(RL)在从头分子生成中特别有价值,智能体通过与环境交互迭代提出分子结构,生成具有类药性、活性和可合成性的化合物。
深度学习技术因其能够建模大型高维数据集中的复杂非线性关系而成为AI驱动药物发现的基石。生成模型如变分自编码器(VAEs)和生成对抗网络(GANs)对从头分子设计产生了变革性影响。VAEs通过学习分子的压缩潜在空间,能够生成具有特定药理学性质的新结构。GANs采用竞争性学习框架,生成候选分子并通过判别器评估其有效性,在产生具有增强多样性和改进结合特征的化合物方面显示出强大能力。
自然语言处理技术能够自动化分析大量非结构化的生物医学文献和专利文档,通过实体识别、语义解析和关系提取从文献中挖掘药理效应、副作用、药物相互作用和疗效信息。基于Transformer的架构如BERT及其生物医学变体(BioBERT)在从复杂句子结构中识别药物-靶点相互作用和其他生物医学关系方面实现了最先进的性能。
数据源与预处理方法
多组学数据提供了细胞状态和分子相互作用的全面快照,使疾病表型和治疗靶点的精确表征成为可能。基因组学涉及DNA测序和分析以识别与疾病相关的突变、结构变异和拷贝数变化。转录组学评估RNA表达谱,提供疾病或药物治疗响应中基因调控的动态洞察。蛋白组学捕获蛋白质丰度、修饰和相互作用,这些都是功能生物学的关键决定因素。
高通量筛选(HTS)能够快速评估数十万至数百万种化合物对疾病相关靶点的生物活性。这些大规模测定对于生成训练和验证ML和DL模型所需的生物活性数据至关重要。AI增强的虚拟筛选方法可以通过预选具有高预测活性的化合物显著提高HTS效率,从而降低成本并提高命中率。
体外生化测定提供了药物-靶点相互作用的精确机制洞察,产生可直接解释并易于集成到AI管道中的明确动力学和热力学参数。除了酶测定外,表面等离子体共振(SPR)、等温滴定量热法和差示扫描荧光法等生物物理方法也越来越被认为是宝贵的AI数据源。
模型训练与验证策略
AI模型训练是一个多阶段过程,需要平衡计算严谨性与生化药理学数据的复杂性。典型工作流程从数据整理和预处理开始,包括分子描述符、生物测定结果或物理化学谱的标准化。模型选择严重依赖于手头任务:分类模型常用随机森林、SVM或深度神经网络,而回归模型通常偏爱梯度提升或图卷积网络(GCNs)。
模型验证是确保预测模型准确且可推广到新化学实体的关键步骤。基于支架的分割基于Bemis-Murcko支架划分化合物,已成为小分子药物发现的金标准,因为它更好地模拟了模型遇到新化学型的真实场景。时间分割验证基于测定测量日期分离训练和测试数据,可以模拟药物开发管道的时间方面,测试AI系统是否能够从历史数据预测未来发现。
AI模型解释方法
AI模型的可解释性对于建立信任、指导药物化学决策和满足监管期望变得越来越重要。特征归因方法如SHapley Additive exPlanations(SHAP)和Local Interpretable Model-agnostic Explanations(LIME)是最广泛使用的可解释性工具,估计每个输入变量对给定预测的贡献。在化学信息学深度学习模型中,注意力机制和梯度可视化方法越来越多地用于精确定位与输出最相关的子结构。
AI驱动的小分子设计工作流程
从头分子生成技术如基于SMILES的循环神经网络(RNNs)和图神经网络(GNNs)提供了从零开始设计具有特定化学和生物学特性的分子的强大手段。条件GNNs可以通过在生成过程中纳入靶点特异性约束或物理化学性质来指导产生具有所需药理学特征的分子。
虚拟筛选和结合亲和力预测旨在通过估计大型化合物库中化合物与靶点结合的可能性来识别生物活性化合物。ML增强的QSAR使用分子描述符来建模化合物结构与其生物活性之间的关系。DL进一步通过能够从蛋白质-配体复合物中捕获空间和化学特征的结构基模型推进了虚拟筛选。
ADMET(吸收、分布、代谢、排泄和毒性)特性是化合物作为药物成功的关键决定因素。AI框架如ADMET-AI利用先进ML模型执行快速、大规模的ADMET分析,整合吸收和毒性终点以协助早期决策和候选物优先排序。深度学习平台如Deep-PK使用GNNs和基于图的分子特征预测70多个ADMET相关终点,在不同化学类别中表现出强大的泛化能力。
癌症免疫治疗靶点与小分子干预
免疫检查点如PD-1、PD-L1、CTLA-4、IDO1和VISTA是T细胞激活和免疫耐受的关键调节因子,已成为癌症免疫治疗的主要靶点。虽然单克隆抗体在检查点阻断的临床领域占主导地位,但小分子因其能够访问细胞内靶点、提供口服生物利用度和降低免疫原性而成为有希望的替代或补充策略。
肿瘤微环境在免疫逃避、进展和治疗抵抗中起关键作用。肿瘤微环境中充满免疫抑制细胞因子、调节性免疫细胞、缺氧应激和代谢副产物如腺苷,所有这些都会损害T细胞活性。肿瘤微环境中最有希望的小分子调节靶点包括TGF-β通路和腺苷A2A受体(A2AR)。
有效的癌症免疫治疗不仅取决于T细胞激活,还取决于通过MHC分子高效呈递肿瘤抗原。然而,许多肿瘤下调抗原加工和呈递机制组件,包括抗原加工相关转运蛋白(TAP)、tapasin和MHC I/II类分子,以逃避免疫检测。通过小分子增强这些通路代表了一种恢复肿瘤免疫原性的有希望策略。
肿瘤细胞利用代谢通路建立免疫抑制微环境,抑制有效的抗肿瘤免疫。其中,精氨酸酶(ARG1/ARG2)和IDO1是两个临床最相关的酶,它们分别消耗关键氨基酸L-精氨酸和色氨酸,从而损害T细胞增殖、激活和效应功能。AI引导的药物发现已成为改变这些靶点识别和优化的变革性工具。
精准肿瘤学与AI驱动的分子设计
患者分层能够基于独特的肿瘤和免疫特征识别最可能对特定治疗响应的个体。AI特别是ML和DL通过整合多组学数据来推导免疫治疗响应的预测模型,已被证明在这一领域具有变革性。这些模型现在正扩展到小分子免疫治疗,其中识别响应亚组对于临床疗效和安全性至关重要。
通过整合转录组、蛋白组和突变数据,AI系统可以生成全面的肿瘤特异性免疫谱,这对于识别可用于治疗干预的行动性新抗原至关重要。AI模型通过学习不同组学层之间的非线性关系,在解读高维数据集的复杂性方面表现出色。
数字孪生技术正在成为精准肿瘤学的变革性组成部分,实现药物响应和治疗策略优化的实时、患者特异性模拟。数字孪生是整合临床、分子、成像和生理数据的个体患者的动态、数据驱动虚拟表示。
AI辅助小分子免疫调节治疗的应用
IDO1因其在色氨酸代谢和肿瘤微环境中的免疫抑制作用而成为癌症免疫治疗的重要靶点。AI的最新进展通过将计算建模、ML和DL管道集成到药物设计过程中,显著加速了小分子IDO1抑制剂的发现和优化。
生成模型和强化学习的整合对于小分子药物发现至关重要,特别是对于免疫检查点等具有挑战性的靶点。生成张量强化学习(GENTRL)是一个深度生成框架,旨在快速识别新型生物活性分子,使用张量分解、VAEs和RL的组合来优化化合物的结合亲和力、类药性和可合成性等特性。
干扰素基因刺激因子(STING)激动剂的发现由于STING通过I型干扰素信号连接先天和适应性免疫的核心作用而在免疫肿瘤学中获得动力。尽管第一代环二核苷酸激动剂存在早期局限性,但最近的进展特别是涉及AI辅助基于结构药物设计的进展已经产生了具有优化药效学和药代动力学的强效、系统可递送STING激动剂。
学术界与工业界的合作
学术界与AI原生生物技术公司之间的战略合作显著加速了AI驱动的小分子免疫治疗的发展。Insilico Medicine与葛兰素史克(GSK)等制药巨头合作识别新的免疫治疗靶点。Exscientia与赛诺菲和百时美施贵宝建立了数百万美元的合作关系,使用其Centaurian平台设计免疫相关治疗。BenevolentAI结合生物医学知识图谱、文献挖掘和ML加速免疫治疗靶点识别。
挑战与局限性
高质量、精心策划的数据是药物发现中AI模型的基础输入。然而,尽管从组学研究、HTS和临床试验中产生了大量生物和化学数据,但主要的数据整理挑战继续阻碍AI模型的性能和泛化能力。数据质量问题源于标签错误、元数据缺失、格式不一致或使用过时的实验方案。
不完整或有偏见的免疫数据集仍然是稳健模型训练和泛化的持续障碍。许多药物-靶点相互作用数据库因其构建方式存在偏见:化合物和蛋白质通常只有在已知相互作用的情况下才被纳入,这扭曲了分布假设并夸大了交叉验证测试中的模型性能。
AI在药物发现中部署的最持久挑战之一是深度学习模型的"黑盒"性质,这使得在临床和监管背景下难以解释和信任。这些模型通常通过捕获大规模高维数据集中的复杂非线性关系来实现高精度,但这是以透明度为代价的。
虽然AI加速了早期药物发现,但从计算机设计到临床应用的转变对于AI设计的小分子免疫治疗仍然是一个重大挑战。许多通过生成模型、RL或DL架构产生的分子在虚拟筛选或生化测定中表现出优异性能,但由于药代动力学问题、脱靶效应或体内免疫原性而未能进展。
未来方向
AI驱动药物发现最具变革性的前沿之一是开发将AI与高通量筛选和自动化实验室平台集成的闭环系统。这些系统形成连续的设计-构建-测试-学习循环,能够快速自主地迭代小分子免疫治疗候选物,大幅减少开发时间并提高命中质量。
随着AI驱动的免疫治疗向个性化发展,在不共享敏感患者数据的情况下实现机构间安全、隐私保护的协作学习变得至关重要。联邦学习已成为支持AI基于药物发现和精准肿瘤学多机构协作的关键技术。
量子计算通过改变支撑小分子发现的分子模拟和优化过程,有望彻底改变AI驱动的药物设计。传统计算药物发现方法难以应对构象空间的组合爆炸和分子相互作用的复杂量子行为。
尽管PD-1/PD-L1和CTLA-4等检查点抑制剂取得成功,但许多患者要么未能响应,要么最终复发,突出发现了新的免疫调节通路的迫切需求。AI驱动的系统生物学正在成为通过整合高维多组学、蛋白质-蛋白质相互作用网络和患者衍生数据集来发现此类靶点的强大方法。
结论
AI通过加速靶点发现、分子优化和个性化治疗开发,正在从根本上重塑癌症免疫调节治疗的小分子药物设计格局。本视角文章强调了AI技术从生成模型和强化学习到多组学整合和数字孪生的融合如何实现以前所未有的精度合理设计免疫调节化合物。
特别是AI在从头分子生成、ADMET预测、患者分层和新免疫通路识别中的应用正在弥合精准肿瘤学中的关键转化差距。尽管存在与数据质量、模型可解释性和监管合规性相关的挑战,但可解释AI、联邦学习和量子辅助模拟等创新提供了有希望的解决方案。
随着高通量自动化和安全协作基础设施的成熟,AI驱动系统很可能成为实时、患者特异性免疫调节治疗开发的重要组成部分。最终,AI与系统生物学和免疫肿瘤学的整合具有提供跨不同患者群体的个性化、持久和可及癌症治疗的变革潜力。

生物通微信公众号
微信
新浪微博


生物通 版权所有