TransGAT-DTA：一个用于药物-靶标亲和力预测和条件分子生成的多任务框架

生物通首页 > 今日动态 > 正文

TransGAT-DTA：一个用于药物-靶标亲和力预测和条件分子生成的多任务框架

时间：2026年1月24日

来源：Biochemical and Biophysical Research Communications

编辑推荐：

提出多任务学习框架TransGAT-DTA，结合图Transformer和门控CNN，解决药物靶点亲和预测与分子生成脱节问题，实验验证其预测误差更小且生成高质靶向分子，为多靶点药物发现奠定基础。

黄晓瑞|刘星宇|周茂源|朱家琪|李家兴|张继瑞|刘天浩|纳斯罗拉·莫加达姆|侯赛因·甘吉杜斯特|郭倩金

北京石油化工技术学院人工智能学院，中国北京102617

摘要

在药物开发过程中，发现能够有效与目标蛋白质相互作用的新分子仍然是一个耗时且成本高昂的挑战。目前的机器学习方法通常局限于单一任务场景，无法同时处理药物-目标亲和力预测和靶向分子生成。为了克服这一限制，我们提出了TransGAT-DTA，这是一个多任务学习框架，它结合了用于分子特征编码的共享图变换器架构和用于分层蛋白质序列表示的门控卷积神经网络（Gated CNNs）。通过一个可学习的对齐模块实现跨模态特征整合，并通过动态梯度协调机制平衡亲和力预测的回归目标与分子生成的变分下界优化。此外，条件控制注意力引导模型生成与预测的目标亲和力一致的分子。在包括BindingDB、Davis和KIBA在内的基准数据集上的实验评估表明，与单一任务模型相比，TransGAT-DTA降低了亲和力预测的均方误差，同时能够生成高质量、针对特定目标的分子。端到端的设计减少了传统级联方法中固有的误差累积，并为双向目标-分子优化提供了一个稳健的框架。这些结果为未来的多目标药物发现应用奠定了基础。

引言

药物发现是一个复杂、资源密集且耗时的过程，其中识别能够高效结合到特定蛋白质目标的小分子化合物是一个核心的技术挑战。尽管传统的实验方法（如高通量筛选HTS）在识别活性化合物方面仍然可靠，但它们通常需要数月到数年的时间，并且会产生数百万美元的财务成本[1]。随着人工智能（AI）技术的快速发展，计算机辅助药物设计（CADD）已成为加速早期药物发现不可或缺的策略，在虚拟筛选、活性预测和分子优化方面表现出特别的优势[[2], [3], [4]]。然而，尽管取得了这些进展，当前的计算方法仍然面临几个关键瓶颈，其中预测模型与生成模型之间的长期分离是阻碍建立有效端到端流程的关键限制[5,6]。

在计算药物发现的更广泛背景下，药物-目标亲和力（DTA）预测与分子生成之间的技术分裂严重限制了研发效率。在预测方面，DTA模型在准确估计已知化合物的结合强度方面取得了稳步改进，例如RRGDTA和MDCT-DTA等方法[[7], [8], [9], [10], [11]]。这些模型提高了基准数据集上亲和力预测的可靠性，并改善了化合物的优先级排序。尽管如此，现有的DTA模型仍然不具备主动设计新候选分子的能力[[12], [13], [14], [15]]，这限制了它们在真正早期探索中的作用。在生成方面，分子生成模型展示了探索广阔化学空间和创建结构多样分子的能力[[16], [17], [18]]。然而，由于缺乏对目标特异性信息的充分整合，只有少数生成的分子在验证后表现出高预测亲和力或令人满意的药理特性。尝试将生成建模与DTA预测相结合的方法（如基于强化学习的流程）仍然受到替代预测器准确性的限制，并未解决与目标特异性和验证效率相关的关键挑战[19]。总体而言，这些因素构成了实现集成“预测-生成”工作流程的主要障碍。

为了进一步了解这些限制，研究单一任务DTA模型的演变是有指导意义的。DeepDTA作为早期的开创性工作，引入了基于神经网络的序列编码用于亲和力预测，但在表示复杂的分子图结构时表现出明显的局限性[20,21]。后续模型如AttentionDTA通过跨模态注意力机制捕获了关键的结合相关区域，提高了可解释性[22]。GraphDTA中引入图神经网络使得分子拓扑的建模更加准确[23,24]，而FusionDTA进一步结合了多源异构特征，在多个基准测试中取得了最先进的性能[25]。在这些基础上，最近的研究探索了结构感知和基于网络的方法来进一步提高DTA预测。对于结构感知方法，HybridGeo采用了几何深度学习框架和混合消息传递策略，明确地模拟了三维蛋白质-配体相互作用以及分子内和分子间的原子依赖性，从而提高了预测准确性和可解释性[26]。类似地，HiSIF-DTA构建了分层蛋白质图，整合了来自接触图的低阶结构语义和来自蛋白质-蛋白质相互作用网络的高阶功能语义，使用自上而下和自下而上的融合策略获得了更丰富的蛋白质表示[27]。

与此同时，基于网络的方法展示了结合更广泛生物学知识的好处。MSF-DTA引入了多源特征融合策略，从PPI和序列相似性网络中收集与生物学相关的邻近蛋白质的额外信息，并使用图预训练框架来捕获节点特征和拓扑连接，从而改进了下游的DTA预测[28]。MHAN-DTA应用了多尺度混合注意力网络，结合了以口袋为导向的特征聚合和跨模态融合，在结合位点上挖掘分子内和分子间的特征，增强了全局感知和预测的稳健性[29]。尽管取得了这些重大进展，单一任务DTA模型仍然受到单一目标范式固有局限性的限制。现代药物开发通常需要同时优化多个分子属性（如效力、选择性、合成可及性和药物类似性），然而现有的预测框架通常仅关注亲和力，缺乏协调多属性优化的机制。此外，它们不提供从头设计分子的能力，进一步限制了它们在探索性场景中的适用性。尽管多任务学习（MTL）理论上通过共享表示学习提供了优势，但它也引入了梯度干扰和任务竞争等挑战[[30], [31], [32]]，这可能阻碍实际分子协同设计任务中的稳定联合优化。

受这些观察的启发，本研究提出了TransGAT-DTA，这是一个旨在弥合亲和力预测和分子生成之间差距的集成多任务学习框架。该框架采用统一的图变换器架构，同时处理分子结构建模、目标序列表示和多目标学习。具体来说，图注意力网络（GATs）用于提取细粒度的分子拓扑特征，而门控卷积网络（Gated CNNs）捕获蛋白质序列中的分层模式。为了增强跨模态信息交换，引入了一个可学习的交互模块来对齐和融合分子和蛋白质表示。

从优化的角度来看，我们提出了一种动态梯度协调策略，通过根据任务特定的不确定性自适应调整梯度大小来减轻任务干扰。为了将目标特异性纳入分子生成，条件注意力机制将亲和力相关的输出转换为三维注意力图，作为下游分子生成的软引导信号。此外，通过混合优化方案整合了药物化学约束，以促进生成分子的药物类似性、合成可及性和现实的结构特性。

在多个基准数据集上的广泛实验表明，TransGAT-DTA在准确性、稳健性和泛化能力方面始终优于最先进的DTA模型。在分子生成任务中，该框架提高了针对特定目标的生成成功率，同时保持了有利的食物类似性和合成可及性特征。在针对代表性治疗蛋白的案例研究中，TransGAT-DTA不仅重建了与已知活性化合物相关的关键化学基序，还生成了多个结构新颖的候选分子，其预测的结合特性得到了进一步验证。

本研究的贡献有两个方面。从理论角度来看，TransGAT-DTA提供了一个端到端的框架，将预测建模和生成建模统一在单一的多任务架构中。提出的跨模态融合设计和动态梯度协调方案为有效的多模态多任务学习提供了见解。从实际角度来看，该框架通过生成化学上合理的、目标感知的分子候选物显著提高了早期药物发现的效率，同时降低了潜在的下游验证成本。由于其灵活的架构，所提出的方法不仅适用于小分子药物设计，也适用于一般的生物分子相互作用建模，为下一代AI驱动的药物发现提供了多功能的基础。

模型训练结果

如图2和图3所示，损失函数曲线和验证集MSE曲线都显示出有利的下降趋势，表明优化效果显著。经过200个训练周期后，训练和验证损失趋于稳定，表明模型已完全收敛。值得注意的是，验证MSE在150个周期后进入了一个平台期，波动范围保持在10%以内，反映了稳定的预测性能。训练周期的选择基于

实验设置

本研究使用表3中显示的配置进行模型训练和性能评估。实验在NVIDIA RTX 4090 GPU（48 GB VRAM）上进行，配备了CUDA 12.4驱动程序和cuDNN加速库以支持深度学习的并行计算。软件环境基于PyTorch 2.4.1构建，以确保模型训练的高效和稳定。对于优化，我们使用了FetterGrad优化器[39]，它在我们的多任务设置中动态协调梯度。

讨论与结论

本研究提出了一个名为TransGAT-DTA的多任务深度学习框架，该框架基于图注意力网络（GAT），创新性地整合了两个关键任务：药物-目标亲和力预测和靶向药物生成。该框架建立了一个统一的特征表示空间，使得这两个任务之间能够相互增强和协调优化。在特征提取方面，它采用了多头注意力机制来捕获复杂的原子间相互作用

CRediT作者贡献声明

黄晓瑞：撰写 – 审阅与编辑，撰写 – 原稿，可视化，验证，数据管理。刘星宇：撰写 – 审阅与编辑，撰写 – 原稿，可视化，验证，数据管理。周茂源：撰写 – 原稿，数据管理。朱家琪：撰写 – 原稿，验证。李家兴：撰写 – 原稿，数据管理。张继瑞：撰写 – 原稿，可视化。刘天浩：可视化，验证。纳斯罗拉·莫加达姆：