引言
人工智能(AI)、机器学习(ML)和深度学习(DL)的快速发展深刻重塑了分子设计与药物发现的格局。特别是深度生成模型、强化学习方法和大规模化学语言模型的出现,实现了具有前景的物理和药理性质的大量分子结构的自动创建。这些方法为探索化学空间的新区域提供了可能性,有望加速早期药物发现、推进材料科学并为化学生物学提供新工具。从传统的迭代实验设计向数据驱动的分子生成的范式转变,已被广泛认为是下一代计算化学的有前途方向。
然而,一个持续的挑战在于对AI系统产生的分子进行评估。虽然生成方法每秒可产生数以千计的候选分子,但只有一小部分能通过基于化学有效性、基本描述符、合成可行性或预测药理性质的自动过滤层。在这些计算步骤之后,仍存在大量需要专家人工评估的候选物。在此阶段,化学家和药理学家等专家会仔细分析二维和三维结构,基于其专业知识和经验评估这些结构的可行性、相关性和改进潜力。这一步在发现流程中不可或缺,因为专家通常能识别自动化工具无法捕捉的结构问题或改进机会。
但这一步仍然零散且低效。在学术和工业背景下,研究人员通常使用本地可视化软件、临时文件共享以及同步或异步的组讨论来评估候选分子。这些做法耗时、容易不一致,并且难以扩展到现代AI模型产生的分子数量。此外,对于这个人工阶段没有标准化的流程或一致的指标集:不同小组优先考虑不同的结构或药理学考量,评估标准高度依赖于背景和经验。例如,在材料科学中,一个分子可能基于其折射光的能力(涉及分析其折射率和影响光学性能的结构特性)进行评估。相比之下,在药物设计中,分子通常基于其溶解度(研究人员评估亲水性和亲脂性等因素,以预测化合物在体液中溶解的好坏,这对于其生物利用度和治疗效果至关重要)进行筛选。因此,AI生成分子的协作评估往往因缺乏专为专家驱动的检查而设计的共享数字环境而受阻。
为了应对这一未满足的需求,一个名为MolVE的基于网络的开源平台应运而生,专门用于支持分子候选物的人工评估。该系统为存储、组织和可视化分子提供了一个安全的环境,特别强调使专家能够使用常见指标以2D和3D检查结构。通过依赖于容器化部署,该平台确保了在学术和工业环境中的简易安装和可扩展性。数据集管理、交互式可视化和用户身份验证等功能促进了协作工作流,允许专家分布式团队在共享的在线空间中异步地管理、注释和讨论候选分子。此外,MolVE提供应用程序编程接口(API)以实现与编程语言的无缝集成,并提供Python服务来运行机器学习和深度学习模型。这些功能尤其重要,因为它们开启了使用MolVE预测来支持使用强化学习训练深度学习模型的可能性,以及使用AI工具支持人工评估。
需要强调的是,MolVE的通用性使其可与任何分子集一起使用,而不仅限于AI模型生成的分子,这使其广泛适用于先进材料科学和从头药物设计等不同研究领域。在药物生成的具体背景下,MolVE旨在加快和简化人工评估阶段,为有效评估新药候选物提供有价值的工具。
网络平台:MolVE
本节概述了该平台的主要功能,重点介绍其ML和DL能力及实现细节,说明该应用程序是如何使用最新且可靠的软件技术构建的。
功能亮点
MolVE经过精心设计,通过提供安全、协作和交互式的平台来支持专家驱动的生成分子候选物的评估。系统的基础是其强大的用户身份验证和账户管理系统,确保敏感数据的保护并实现可追溯性。用户通过基于登录的系统访问平台,这不仅保护了环境,还允许管理员跟踪个人对评估过程的贡献。用户账户有两种类型:具有扩展权限并可访问管理员面板的管理员,以及仅专注于评估分子的普通用户。
管理员面板作为一个综合仪表板,提供了平台活动的全景视图。它向管理员提供关键指标,如分子总数和评估汇总计数。此功能对于监控评估过程的进展和有效性至关重要。此外,管理员可以通过上传或移除空间数据文件(SDF)以及审查用户提交的评估来管理正在评估的分子。这确保了所有评估都符合质量标准并保持一致。此外,管理员可以管理用户账户,根据需要更改访问级别或添加/移除用户,并决定有关是否可以在不登录平台的情况下查看分子的访问控制策略。
管理员面板中的一个独特功能是控制分子如何向专家显示的能力。管理员可以灵活选择三种分子评估显示模式之一,从而根据特定的研究目标或操作要求定制流程:
- •
随机显示模式:此模式允许专家多次评估分子,使每个分子能从不同角度获得评估。例如,在药物设计中,一个分子可能需要由化学家评估其合成可行性,同时由药理学家评估其作为治疗剂的潜在疗效和安全性。这在后期汇总信息时特别有益,因为它可以对来自不同专家的意见进行加权。此外,专家可以对同一分子进行多次评估,这对于分析其评估的一致性很有价值。例如,同一位专家评估的高方差可能表明其评估过程中的随机性。管理员对后评估数据进行的此类分析,可能为了解评估的可靠性提供见解。
- •
未评估优先显示模式:此模式优先显示尚未评估的分子,确保在大数据集上获得广泛的评估覆盖。这在需要快速收集大量分子的评估时特别有用。
- •
基于共识的显示模式:MolVE允许加载不同的分子集,每个分子集都带有标签,例如生成模型的名称。基于MolVE的这一特性,此评估模式优先显示属于更多集合的分子。这种方法受到了专家委员会概念的启发,其中每个模型作为提出潜在分子的独立专家。当多个模型独立地建议同一分子时,这表明了强烈的共识和增强的可靠性,类似于委员会达成一致,因此值得更高的评估优先级。
评估页面是分子评估的主要界面,管理员和普通用户均可访问。它呈现关键的分子属性,如合成可及性评分(SAS)、天然产物评分(NPS)及其预测置信度、分子量、LogP以及氢键供体和受体,以告知用户评估。此外,它还具备关于分子优先排序的机器学习模型的预测。该平台采用JSmol和ChemDoodle进行交互式的3D和2D可视化,允许用户通过旋转、改变颜色和更改显示设置来操作分子结构。这种交互性增强了用户理解分子几何和属性的能力。除了这些功能,评估页面还提供对详细分子信息的访问,包括原子坐标和SMILES表示,这些信息也可以下载为.sdf文件以供离线分析或进一步计算属性。
评估界面本身通过定性评级量表支持结构化反馈:“优先排序”、“边缘”和“不优先排序”。此外,用户可以使用复选框指定与分子结构相关的问题,如“溶解度”、“合成可及性”、“维度”和“渗透性”,并通过文本描述提供进一步的见解。选择这种描述性量表是为了遵循MolVE的目标(即是否优先考虑一个分子),并适应化学家多样化的观点和经验,他们可能对同一分子的结构和可行性方面持有不同意见。确实,专家(如化学家和药理学家)的评估可能深受其个人背景和专业知识的影响,导致对分子可行性的不同解释和评估。因此,例如,0到10的数字量表在保持一致性和意义方面会带来挑战,因为专家意见的差异可能导致分数的高方差。通过提供一组描述性的细分类别,该平台简化了评估过程,允许化学家用更广泛、更容易比较的术语表达其评估,直接与决定是否将分子推进到下一阶段的最终目标保持一致。这种方法促进了评估者之间更清晰的沟通和共识建立,确保反馈在不同用户之间保持有意义和可操作性。
系统在设计时考虑了灵活性,允许管理员下载最终的评估结果,其中包含所有必要的信息,如用户身份、分数、评论和评估日期。这种全面的数据导出旨在通过提供原始数据进行分析来支持多样化的研究场景。重要的是,该平台有意避免提供对这些结果的任何内置自动分析。缺乏特定的分析工具确保了平台能够适应各种应用,而不是被预定义的分析框架所限制。
独特能力
总而言之,MolVE的所有能力使其在现有的化学信息学平台中独树一帜。首先,它明确以定性的专家优先排序为中心,而不仅仅是可视化或属性计算,为大规模、结构化的人工分子评估提供了一个基于角色的、基于网络的环境。其次,它提供可配置的评估模式(随机显示模式、未评估优先显示模式和基于共识的显示模式),直接支持在受控的专家评估下比较不同AI模型或数据集的研究设计。第三,MolVE紧密集成了一个用于ML和DL模型的后端Python服务,实现了上传化合物的自动评分以及在强化学习工作流中的无缝使用。最后,所有评估(分数、标记、评论、时间戳和用户身份)都以标准化格式导出,以便它们可以重新用于训练或改进AI模型,将专家反馈转化为机器可读的监督数据。
机器学习和深度学习功能
MolVE允许运行机器学习(ML)和深度学习(DL)模型来增强评估过程。具体来说,其当前版本利用一个ML模型来建议给定分子的优先排序分数。此功能具有巨大的潜力,例如增强人工评估过程,并实现系统内分子的自动优先排序。事实上,上传到平台的每个分子都会自动被评估,并且此预测功能可通过API访问,允许无缝集成到强化学习模型中。
当前的机器学习模型基于随机森林,利用数据集中的模式,其中每个分子由摩根指纹表示。该数据集包括FDA批准的药物和TumFlow生成的分子。它被分为训练集和测试集。FDA批准的药物被标记为“优先排序”,而具有高合成可及性评分的TumFlow分子被标记为“不优先排序”。为确保鲁棒性,训练期间使用了5折交叉验证,通过在不同数据子集上评估模型来增强泛化能力。该模型的集成使MolVE能够有效地将AI生成的见解与用户评估结合起来。
需要注意的是,虽然当前的模型是在预定义的一组分子上训练的,但它为将来将通过MolVE收集的专家评估整合到训练过程中奠定了基础。受自然语言处理中训练深度学习模型来模拟人类反馈的策略启发,对分子评估也设想了类似的方法。因此,未来的工作涉及增强当前模型以复现专家评估,从而实现对更广泛分子集的高效评估,将其能力从优先排序分数扩展到预测合成可行性和渗透性等结构问题。
实现细节
该平台是一个全栈解决方案,旨在通过结构良好的客户端-服务器模型提供无缝的用户体验。它分为四个主要组件:客户端界面、后端API、数据库和Python服务API。整个应用程序使用免费、开源技术构建,提高了其成本效益,并允许进行广泛的定制和扩展。
在客户端,React因其基于组件的架构而被使用,这促进了模块化和可重用UI组件的创建。Tailwind CSS对其进行了补充,它采用实用优先的方法增强了用户界面,实现了与React组件无缝集成的快速响应式样式。
在服务器端,Node.js凭借其非阻塞、事件驱动的架构为后端提供动力,非常适合构建可扩展的网络应用程序。Vite被选为构建工具和开发服务器,因其快速的编译时间和高效的热模块替换,共同显著提升了开发体验。Express被集成以处理服务器端逻辑和路由,为管理HTTP请求提供了强大的框架。安全性和会话管理通过Passport与express-session一起处理,确保用户会话得到安全高效的管理。在整个应用程序中,使用了TypeScript,它提供的静态类型通过在编译时捕获错误来提高代码质量。
在数据库管理方面,PostgreSQL因其可靠性和处理复杂查询和事务的能力而被使用。Drizzle ORM的集成进一步简化了数据库交互,提供了一种类型安全且高效的方法来查询和管理数据库模式,从而提高了代码可靠性和开发人员生产力。
Python服务使用FastAPI构建,部署在一个独立的系统中,该系统仅与MolVE后端交互,从而通过将其与外部访问隔离来增强安全性。
容器化是部署策略的一个关键方面,通过Docker和Docker Compose实现。这种方法确保了应用程序在不同环境(从开发到生产)中运行的一致性,从而简化了部署过程。Docker将应用程序及其依赖项封装到一个单一的、可移植的容器中,而Docker Compose则自动化了数据库和其他服务的部署,提供了一个快速、即用且可靠的设置。
相关工作
据目前所知,还没有基于网络的工具提供与MolVE相同的功能组合。最接近的相关系统是Metis,这是一个基于Python的图形界面,允许化学家提供关于从头生成分子的反馈,包括偏好的子结构和项目约束。Metis与REINVENT集成,将这些反馈纳入奖励模型,支持迭代、闭环设计。MolVE是其补充:Metis是一个桌面风格的Python应用程序,专为特定从头设计循环内的化学家或小型团队设计,而MolVE是一个通用的、基于网络的平台,用于大规模、分布式和异步的分子集专家评估。主要区别包括:
- •
部署和可访问性:MolVE是一个基于浏览器访问、Docker化的网络应用程序,由PostgreSQL支持,无需本地安装。Metis依赖于本地Python栈,目前无法托管于网络。
- •
协作和规模:MolVE支持基于角色的用户管理、身份验证和显示模式(随机等),使分布式团队能够协调评估大量分子集合。Metis针对特定从头设计运行中交互式、以项目为中心的反馈进行了优化。
- •
集成和重点:MolVE公开了通用的REST API和基于FastAPI的Python服务,用于任意的ML/DL模型,强调使用结构化问题标记和跨异构分子集的集成预测进行标准化的定性优先排序(“优先排序”等)。Metis与REINVENT紧密耦合,侧重于详细(通常是子结构级别)的反馈,以构建奖励模型并完善特定的设计活动。
总之,Metis和MolVE都支持人在环生成化学,但针对不同的场景:Metis作为特定从头设计框架内的Python原生界面,而MolVE作为一个基于网络的多用户平台,用于可扩展的、模型无关的分子评估和优先排序。
除了Metis之外,各种化学信息学工具提供分子可视化、属性计算或工作流管理。这些包括独立应用程序和库,例如基于RDKit的查看器和脚本环境、DataWarrior,以及主要专注于2D/3D渲染和基本描述符计算的基于网络的查看器。然而,此类工具通常面向单用户分析或批量属性计算,不提供用于结构化、大规模专家分子集优先排序的基于角色的、浏览器可访问的环境。相比之下,MolVE明确设计用于支持具有可配置显示模式和标准化定性反馈的分布式、多用户评估,在单一的集中式平台中将人类判断与机器学习模型紧密集成。
案例研究:TumFlow生成分子的评估
为了说明MolVE如何与外部机器学习模型集成并支持专家评估,我们使用TumFlow生成的分子进行了一个小型案例研究。一组TumFlow生成的结构通过其REST API导入到MolVE中,自动从SDF格式解析,并与标识TumFlow作为源模型的元数据一起存储。对于每个导入的分子,MolVE的后端调用集成的机器学习(ML)模型来产生初步的优先排序建议。这些预测与计算出的分子属性(例如SAS、NPS、分子量、LogP)以及评估页面上的交互式2D/3D可视化一起显示。一小群药物化学家随后使用MolVE审查了这些TumFlow生成分子的一个子集。专家通过标准网络浏览器访问该平台,无需安装任何额外软件,并使用“未评估优先”显示模式评估分子,以确保对集合的广泛覆盖。对于每个结构,他们分配一个定性标签(“优先排序”、“边缘”或“不优先排序”),可选地标记问题,如溶解度、合成可及性、大小或渗透性,并在需要时记录自由文本评论。
即使在这个有限的规模下,该案例研究也突出了MolVE的独特方面:
- •
模型无关集成:TumFlow生成的分子通过API摄取,表明MolVE可以作为多样化生成模型和外部流程的通用、基于网络的前端。
- •
统一的人工-AI评估:基于ML的优先排序建议和化学信息学描述符与专家评分和评论呈现在同一界面中,使化学家能够快速识别并专注于人类判断与模型预测不一致的分子。
- •
分布式、基于角色的评估:所有评估,包括用户身份、时间戳、定性标签、问题标记和评论,都记录在集中式PostgreSQL数据库中。这允许管理员监控TumFlow集合的覆盖范围,导出标准化的评估数据用于下游分析,并可能重新使用这些注释来改进未来的ML模型。
该案例研究的目的并非旨在详尽覆盖所有TumFlow生成的分子,而是为了展示MolVE在现实环境中的实际部署:连接外部生成模型,自动对其输出进行评分,并在单一的基于网络的平台内以结构化、可重复的方式实现专家审查。
结论和未来工作
MolVE为应对先进材料科学和药物发现中日益增长的人工评估分子候选物的挑战提供了一个全面的解决方案。这个安全的、开源的、基于网络的平台专为专家进行异步、分布式和协作评估而设计。它具有交互式2D和3D可视化、API集成、ML预测和结构化定性反馈系统,简化专家评估的同时适应多样化的评估标准。其全栈、容器化的架构确保了在学术和工业环境中的可扩展性和易于部署。通过支持快速有效的人工评估,MolVE加速了科学研究,促进了早期阶段更高效和可重复的决策。
未来的工作将集中于利用该平台收集一个全面的数据集,用于训练一个机器学习模型,该模型可以超越当前模型的能力来增强分子优先排序预测。利用这个新的数据集,该模型还可以被训练来识别潜在的结构问题,这是现有模型所不具备的能力。这一进步可以通过提供快速、类似专家的分子评估来显著改进决策,从而简化药物发现的早期阶段。此外,未来的工作将致力于整合机器学习和深度学习模型来评估各种属性,例如毒性。深度学习模型也将被训练来生成新的分子,特别侧重于利用由MolVE促进的强化学习创建高优先级的候选物。最后,未来的工作将集中于整合协作功能、高级分析,并确保与其他计算流程的互操作性,以进一步增强评估过程。