药物发现是一个复杂、资源密集且耗时的过程,其中识别能够高效结合到特定蛋白质目标的小分子化合物是一个核心的技术挑战。尽管传统的实验方法(如高通量筛选HTS)在识别活性化合物方面仍然可靠,但它们通常需要数月到数年的时间,并且会产生数百万美元的财务成本[1]。随着人工智能(AI)技术的快速发展,计算机辅助药物设计(CADD)已成为加速早期药物发现不可或缺的策略,在虚拟筛选、活性预测和分子优化方面表现出特别的优势[[2], [3], [4]]。然而,尽管取得了这些进展,当前的计算方法仍然面临几个关键瓶颈,其中预测模型与生成模型之间的长期分离是阻碍建立有效端到端流程的关键限制[5,6]。
在计算药物发现的更广泛背景下,药物-目标亲和力(DTA)预测与分子生成之间的技术分裂严重限制了研发效率。在预测方面,DTA模型在准确估计已知化合物的结合强度方面取得了稳步改进,例如RRGDTA和MDCT-DTA等方法[[7], [8], [9], [10], [11]]。这些模型提高了基准数据集上亲和力预测的可靠性,并改善了化合物的优先级排序。尽管如此,现有的DTA模型仍然不具备主动设计新候选分子的能力[[12], [13], [14], [15]],这限制了它们在真正早期探索中的作用。在生成方面,分子生成模型展示了探索广阔化学空间和创建结构多样分子的能力[[16], [17], [18]]。然而,由于缺乏对目标特异性信息的充分整合,只有少数生成的分子在验证后表现出高预测亲和力或令人满意的药理特性。尝试将生成建模与DTA预测相结合的方法(如基于强化学习的流程)仍然受到替代预测器准确性的限制,并未解决与目标特异性和验证效率相关的关键挑战[19]。总体而言,这些因素构成了实现集成“预测-生成”工作流程的主要障碍。
为了进一步了解这些限制,研究单一任务DTA模型的演变是有指导意义的。DeepDTA作为早期的开创性工作,引入了基于神经网络的序列编码用于亲和力预测,但在表示复杂的分子图结构时表现出明显的局限性[20,21]。后续模型如AttentionDTA通过跨模态注意力机制捕获了关键的结合相关区域,提高了可解释性[22]。GraphDTA中引入图神经网络使得分子拓扑的建模更加准确[23,24],而FusionDTA进一步结合了多源异构特征,在多个基准测试中取得了最先进的性能[25]。在这些基础上,最近的研究探索了结构感知和基于网络的方法来进一步提高DTA预测。对于结构感知方法,HybridGeo采用了几何深度学习框架和混合消息传递策略,明确地模拟了三维蛋白质-配体相互作用以及分子内和分子间的原子依赖性,从而提高了预测准确性和可解释性[26]。类似地,HiSIF-DTA构建了分层蛋白质图,整合了来自接触图的低阶结构语义和来自蛋白质-蛋白质相互作用网络的高阶功能语义,使用自上而下和自下而上的融合策略获得了更丰富的蛋白质表示[27]。
与此同时,基于网络的方法展示了结合更广泛生物学知识的好处。MSF-DTA引入了多源特征融合策略,从PPI和序列相似性网络中收集与生物学相关的邻近蛋白质的额外信息,并使用图预训练框架来捕获节点特征和拓扑连接,从而改进了下游的DTA预测[28]。MHAN-DTA应用了多尺度混合注意力网络,结合了以口袋为导向的特征聚合和跨模态融合,在结合位点上挖掘分子内和分子间的特征,增强了全局感知和预测的稳健性[29]。尽管取得了这些重大进展,单一任务DTA模型仍然受到单一目标范式固有局限性的限制。现代药物开发通常需要同时优化多个分子属性(如效力、选择性、合成可及性和药物类似性),然而现有的预测框架通常仅关注亲和力,缺乏协调多属性优化的机制。此外,它们不提供从头设计分子的能力,进一步限制了它们在探索性场景中的适用性。尽管多任务学习(MTL)理论上通过共享表示学习提供了优势,但它也引入了梯度干扰和任务竞争等挑战[[30], [31], [32]],这可能阻碍实际分子协同设计任务中的稳定联合优化。
受这些观察的启发,本研究提出了TransGAT-DTA,这是一个旨在弥合亲和力预测和分子生成之间差距的集成多任务学习框架。该框架采用统一的图变换器架构,同时处理分子结构建模、目标序列表示和多目标学习。具体来说,图注意力网络(GATs)用于提取细粒度的分子拓扑特征,而门控卷积网络(Gated CNNs)捕获蛋白质序列中的分层模式。为了增强跨模态信息交换,引入了一个可学习的交互模块来对齐和融合分子和蛋白质表示。
从优化的角度来看,我们提出了一种动态梯度协调策略,通过根据任务特定的不确定性自适应调整梯度大小来减轻任务干扰。为了将目标特异性纳入分子生成,条件注意力机制将亲和力相关的输出转换为三维注意力图,作为下游分子生成的软引导信号。此外,通过混合优化方案整合了药物化学约束,以促进生成分子的药物类似性、合成可及性和现实的结构特性。
在多个基准数据集上的广泛实验表明,TransGAT-DTA在准确性、稳健性和泛化能力方面始终优于最先进的DTA模型。在分子生成任务中,该框架提高了针对特定目标的生成成功率,同时保持了有利的食物类似性和合成可及性特征。在针对代表性治疗蛋白的案例研究中,TransGAT-DTA不仅重建了与已知活性化合物相关的关键化学基序,还生成了多个结构新颖的候选分子,其预测的结合特性得到了进一步验证。
本研究的贡献有两个方面。从理论角度来看,TransGAT-DTA提供了一个端到端的框架,将预测建模和生成建模统一在单一的多任务架构中。提出的跨模态融合设计和动态梯度协调方案为有效的多模态多任务学习提供了见解。从实际角度来看,该框架通过生成化学上合理的、目标感知的分子候选物显著提高了早期药物发现的效率,同时降低了潜在的下游验证成本。由于其灵活的架构,所提出的方法不仅适用于小分子药物设计,也适用于一般的生物分子相互作用建模,为下一代AI驱动的药物发现提供了多功能的基础。