MoLA：一种用于分子性质预测的分子多模态分层自适应网络

时间：2026年2月18日

来源：Knowledge-Based Systems

编辑推荐：

分子属性预测是药物发现和材料科学的核心问题，传统方法依赖人工分子描述符且泛化性差。本文提出多模态自适应网络MoLA，通过跨层注意力融合机制动态整合分子指纹、SMILES和图结构信息，并创新性地在指纹分支嵌入树突神经元模块，增强对复杂化学特征的建模能力。实验表明，MoLA在MoleculeNet 12个基准数据集上均优于现有方法，特别是在结合局部结构信息和全局化学性质方面表现突出。

富山大学工程学院，日本富山市930-8555

摘要

分子性质预测在药物发现和材料科学中至关重要，利用多模态分子表示已成为提高预测性能的核心策略。然而，大多数现有的多模态融合框架采用浅层或刚性的融合机制，隐含地假设简单聚合异构特征就足以捕捉复杂的生化特性。这忽视了一个关键挑战：尽管不同模态对多样化的分子性质贡献不同，但模态整合的合理性和适应性仍然很大程度上未被探索。简单的融合可能会引入冗余、噪声，甚至掩盖重要的跨模态关系。为了解决这些限制，我们提出了MoLA（分子多模态分层自适应网络），这是一种专为分子性质预测设计的新颖多层神经架构。其核心是采用跨层注意力融合机制，以自适应地构建多模态相关图，实现跨模态和网络深度的选择性和细致的信息交换。值得注意的是，MoLA还在指纹分支中集成了树突神经元模块，增强了其捕捉受生物神经计算启发的复杂、上下文依赖的特征交互的能力。在MoleculeNet系列多个基准测试上的广泛实验表明，MoLA在各种分子性质预测任务中取得了最先进的性能，突显了合理和自适应多模态融合在计算化学中的重要性。代码实现可在提供的仓库中找到：https://github.com/Rirock/MoLA

引言

分子性质预测在药物发现、环境化学和材料科学等各个科学领域都至关重要[1]、[2]。准确预测分子特性可以显著加速化合物筛选，降低实验成本，并促进有效治疗药物的开发[3]、[4]。传统的计算方法，包括定量结构-活性关系（QSAR）模型，通常依赖于手工设计的分子描述符和单模态输入，这限制了它们的预测能力和泛化能力[5]。

最近，机器学习和深度学习方法通过使用各种分子表示方法大大增强了分子预测任务[6]、[7]。简化分子输入行输入系统（SMILES）是一种文本形式的分子表示方法，能够有效捕捉原子和键的详细序列信息[8]、[9]。基于SMILES的方法，特别是那些采用Transformer架构的方法，在建模序列依赖性和提取语义化学信息方面表现出色，但缺乏明确的空间结构背景[7]。分子指纹，如扩展连通性指纹（ECFP），通过总结分子子结构及其出现情况，提供了简洁高效的表示方法，使其适用于大规模分析[10]、[11]。然而，指纹方法抽象掉了详细的结构细微差别，丢失了明确的关系和空间信息[12]。基于图的表示方法通过分子图明确编码空间连通性和关系细节，图神经网络（GNN）在建模分子拓扑结构方面表现出强大的能力[13]、[14]、[15]。尽管在捕捉局部结构模式方面具有优势，但图表示方法往往忽略了全局化学性质和详细的原子级序列[16]。

为了克服单模态方法的局限性，研究人员越来越多地采用集成多种分子表示的多模态框架[17]。最近的多模态方法包括使用GNN和全连接神经网络结合图和指纹表示[12]，或者利用Transformer和GNN架构整合SMILES和图表示[18]。这些方法通过利用跨模态的互补信息展示了改进的预测性能。例如，先前的研究表明，结合SMILES和图表示可以增强序列和结构特征的提取，显著提高各种分子任务的预测准确性[19]。然而，当前的多模态方法通常采用浅层融合技术，每种模态都通过不同的神经网络独立处理，只有它们的最终表示被合并。这样的方法未能充分利用跨模态的深层层次交互和丰富的互补信息，限制了它们的预测能力[12]、[21]。

为了解决这些限制，我们提出了MoLA，这是一种专为分子性质预测设计的分子多模态分层自适应网络。MoLA在网络的浅层和深层实现了异构分子表示（如分子图、指纹和SMILES）的层次化和自适应融合。与仅在最终阶段合并输出的传统方法不同，MoLA在整个特征提取过程中实现了动态的信息交换和模态之间的选择性整合。这种设计使模型能够捕捉多个抽象层次上的细粒度和任务相关的交互。此外，MoLA在指纹处理路径中集成了树突神经元模块。受生物神经元中分区计算的启发，树突神经元模块将特征转换分解为局部的突触和非线性过程，然后进行体细胞聚合。这种机制使网络能够选择性地增强重要的分子特征，从而提高表达能力和可解释性[22]。

尽管MoLA由成熟的架构组件组成，但其贡献在于在统一框架内原则性地协调了跨层融合和指纹特定的树突建模。与仅在单一抽象层次进行融合或将指纹编码器视为通用MLP的先前方法不同，MoLA引入了一种自适应的分层整合机制，允许不同的模态和表示深度动态交互。

我们在MoleculeNet的十二个基准数据集上评估了MoLA，涵盖了分类和回归任务。实验结果表明，MoLA始终优于最先进的单模态和多模态基线，在各种化学终点上实现了卓越的预测性能。我们的贡献如下：

我们设计了MoLA，这是一种实现网络层次化、自适应多模态融合的新架构。

我们引入了一种受生物学启发的树突神经元模块，增强了分子指纹的建模能力。

我们在十二个公共基准测试上进行了广泛的实验，取得了新的最先进结果，证明了我们方法的有效性。

问题定义

分子性质预测是根据分子的计算表示来估计其化学或生物性质的任务。形式上，给定一个由多模态数据X表示的分子，目标是学习一个预测函数F，使得

y = F (X)

，其中y表示目标性质，X包括各种分子表示，如指纹、SMILES字符串和基于图的结构。

结构概述

MoLA是一个专为分子性质预测设计的多模态框架

数据集

为了系统地评估我们方法的泛化能力和鲁棒性，我们在MoleculeNet的一系列基准数据集上进行了实验，MoleculeNet是广泛用于分子性质预测的资源。具体来说，我们的评估涵盖了六个分类数据集和四个回归数据集，涵盖了包括毒性分类、血脑屏障穿透、溶解度估计和量子力学性质预测等一系列任务。所有数据集均已获取

结论

在这项工作中，我们提出了MoLA，这是一种用于分子性质预测的多模态神经网络，它通过统一的跨层注意力和融合框架自适应地整合了指纹、SMILES和基于图的表示。通过结合树突神经元模块和自适应聚合策略，MoLA有效地捕捉了跨异构分子模态的互补信息。广泛的实验表明，在多个基准测试上取得了最先进的性能

作者声明

我们签署人声明本手稿是原创的，之前未发表，目前也没有在其他地方被考虑发表。

我们确认所有列出的作者都已阅读并批准了该手稿，并且没有其他符合作者资格标准但未列出的人。我们进一步确认手稿中列出的作者顺序得到了所有人的批准。

我们理解通讯作者是唯一的联系人

未引用的图表

图1，图2。

CRediT作者贡献声明

Jiayi Li：撰写——原始草稿、可视化、验证、软件、方法论、调查、概念化。Zihang Zhang：可视化、验证、软件、方法论、形式分析。Zhenyu Lei：监督、方法论、调查、形式分析、概念化。Jiujun Cheng：监督、资源、方法论、形式分析。Lianbo Ma：监督、方法论、调查、形式分析。Cong Liu：监督、调查、形式分析。Shangce Gao：