蛋白质-配体结合亲和力的预测是计算机辅助药物发现的基础,能够以较低的成本加速治疗药物的研发过程。尽管图神经网络架构取得了进展,但现有方法未能充分整合异构的分子表示形式,这限制了它们模拟蛋白质-配体相互作用复杂多模态特性的能力。
我们提出了一种可解释的异构卷积网络,其核心创新在于早期多模态相互作用融合机制。该方法在特征提取的初始阶段就整合了互补的分子表示形式,包括结构拓扑、理化性质和相互作用动态。与传统的全局融合策略不同,我们的早期多模态相互作用融合通过异构图卷积实现了跨模态特征学习,使残基节点能够在每个卷积层中聚合来自蛋白质的结构信号和蛋白质-配体界面的结合信息。仅使用结合口袋-配体数据,该框架的性能即可与全蛋白质多模态模型相当甚至更优。在PDBbind基准测试中的评估表明,我们的框架在数据需求较低的情况下仍能达到最先进的性能。消融研究验证了多模态相互作用融合机制的贡献,可解释性分析显示多模态相互作用边在识别结合亲和力的关键分子决定因素方面起着重要作用。将该方法应用于非小细胞肺癌领域展示了其实际价值。开源代码:
https://github.com/trybestxk/IHGCN-PLA.