准确识别药物-靶点相互作用(DTIs)是药物发现和再利用的核心步骤。在这一过程中,高效筛选潜在活性化合物不仅可以大幅缩短研发周期,还可以显著降低体外实验带来的高昂成本和资源浪费[1]、[2]。随着生物医学大数据的快速增长,开发具有高准确性和强泛化能力的计算DTI预测方法已成为突破传统药物研发瓶颈的迫切需求。DTI预测技术的发展历史反映了人们对生物分子特性的深入认识。早期的传统方法,如分子对接模拟和基于配体的策略,为这一领域奠定了坚实的基础。然而,由于高质量三维结构数据的稀缺性和对复杂分子间相互作用建模的限制,这些方法难以应用于大规模筛选[3]、[4]。后续的机器学习方法,包括支持向量机(SVM)、随机森林[5]、[6]、旋转森林[7]和矩阵分解[8]、[9]、[10],通过引入统计特征提高了预测效率。然而,它们对人工特征工程的依赖性强且无法捕捉非线性生物模式,限制了模型的潜力[11]。
近年来,由于深度学习强大的表示学习能力,它已成为DTI预测的主流范式。早期的深度学习模型主要关注序列信息的挖掘。例如,DeepDTA[12]、TransformerCPI[13]、MolTrans[14]和MSCMLCIDTI[15]分别使用卷积神经网络(CNN)或Transformer架构从SMILES字符串和蛋白质序列中提取特征。尽管这些基于序列的方法可以有效捕捉上下文模式,但它们常常忽略分子的拓扑结构,导致关键结构信息的丢失。为了解决这个问题,基于图神经网络(GNN)的方法应运而生。包括GraphCPI[16]、GraphDTA[17]、iNGNN-DTI[18](结合AlphaFold2[19]结构)以及SGCL-DTI[20]和GSL-DTI[21]在内的研究,将药物视为拓扑图,并使用图卷积网络(GCNs)或图注意力网络(GATs)提取原子间的几何和化学属性。尽管基于图的方法在结构表示方面取得了突破,但它们通常局限于局部邻域聚合,难以捕捉长距离语义依赖性。
为了进一步模拟药物和靶点之间的实际结合过程,引入了注意力机制来加强相互作用建模。DrugBAN[22]结合了双线性网络[23],而HyperAttentionDTI[24]、CoaDTI[25]和MCANet[26]等研究试图通过双线性注意力、共注意力或多头交叉注意力来关注在结合中起关键作用的局部区域。同时,随着大型语言模型(LLMs)的兴起,利用预训练模型(如Prot-BERT)提取高维语义特征的多模态方法(如MGNDTI[27]、ColdstartCPI[28])展示了巨大潜力。然而,尽管现有的多模态和注意力增强方法取得了显著进展,当前的DTI预测方法仍面临两个核心瓶颈:首先,生物特征表示仅限于单一模态数据,无法全面捕捉药物和靶点的多层次属性;其次,相互作用建模的深度不足,无法完全揭示两者之间的复杂依赖关系。
为了克服上述限制,本文提出了一个基于双分支协作机制的多模态特征融合DTI预测框架(DBCA-DTI),旨在通过多源特征协作建模和深度交互机制的设计,实现特征表示的全面性和多模态融合的效率。具体而言,第一个分支基于LLMs构建,分别使用Prot-BERT和SMILES-BERT对蛋白质和药物分子进行高维语义编码,从而在序列层面提取丰富的上下文语义表示。为了进一步提高语义信息提取的效率,我们设计了全局-局部协作特征提取器(GLNet)来捕捉序列内的细粒度相关特征,以及双向自适应门控交叉注意力(BiAGCA)模块,显著增强了模型感知和建模药物-蛋白质相互作用模式的能力。第二个分支采用差异化建模策略来补充物理化学信息。该分支基于RDKit[29]提取药物的结构描述符,并通过氨基酸编码生成蛋白质的基本物理化学特征。为了捕捉蛋白质序列的多层次功能模式,设计了多尺度自适应卷积模块(Adaptive MCNN);同时,集成KAA-GAT[30]网络来融合药物分子的拓扑结构和化学属性,实现结构模态的深度表示。BiAGCA模块也应用于此分支,以进一步探索药物和蛋白质在不同层次和片段间的复杂相互作用关系。最后,该框架通过多模态特征融合(MultiFusion)模块自适应地加权并整合两个分支的输出,然后将融合的高维特征输入分类器以生成最终的DTI预测结果。该框架在语义和物理化学层面实现了特征协同,为提高DTI预测的准确性和泛化能力提供了新的解决方案。本研究的主要贡献总结如下:
•我们提出了一个双分支协作多模态特征表征框架。LME分支利用大型语言模型获得药物和蛋白质的高维语义嵌入,而PFE分支提取它们的物理化学属性特征,从而增强了特征描述的全面性和鲁棒性。
•我们设计了双向自适应门控交叉注意力(BiAGCA)模块,通过动态门控和双向依赖建模精确捕捉药物和蛋白质亚单位之间的协同相互作用,解决了传统单向注意力机制中缺乏交互信息的问题。
•我们设计了一个具有统一集成机制的多模态特征融合模块,用于分层组合双分支特征。这增强了多源信息的协调性和特征一致性,显著提高了预测准确性和泛化能力。