引言:药物发现新范式
药物发现是一个漫长、昂贵且高风险的过程,涵盖从新靶点识别到将安全有效药物交付给患者的全链条。尽管已有预测性AI(如QSAR模型)和生成性AI(如设计新化学结构)的广泛应用,但这些范式存在共同局限:它们是被动工具,需要人工反复准备输入和解释输出,无法自主协调贯穿整个药物发现复杂过程中的多步推理与决策。
一种被称为“智能体AI”的新兴系统浪潮有望克服这些限制。智能体AI建立在近期大语言模型(LLM)推理能力突破之上,但将其与外部工具、记忆和数据源相结合,使系统能够在迭代循环中进行“思考”、“行动”、“观察”和“反思”。这些智能体并非单一模型,而是能够协同工作、检索文献、筛选化合物、预测肝毒性或心脏毒性等终点、规划实验甚至对接实验室自动化的自适应独立组件,预示着药物发现模式的根本性重塑。
智能体AI:概念与系统设计
智能体AI的核心是具备“推理”能力的LLM,但其自身无法与现实世界交互或获取训练集之外的数据。为此,LLM需与外部工具整合。在药物发现背景下,智能体工具可分为四大功能类型:
- 1.
感知工具:作为系统的增强层,从结构化与非结构化的生物医学数据库(如ChEMBL、PubChem、STRING、Reactome)中收集信息。
- 2.
计算工具:实现预测、模拟、数据分析等计算行为,通常作为预训练模型(如AlphaFold)或数据处理流程的封装。
- 3.
行动工具:使智能体系统能在现实世界中行动,例如连接机器人移液、自动化细胞实验或下一代测序文库制备,从而在计算机设计与实验验证间形成稳健闭环。
- 4.
记忆工具:通过存储、检索、压缩和更新智能体的工作知识,实现跨任务和会话的持久性,在药物发现中捕获SAR模式、累积的毒性发现等可重复使用的知识,为多步推理提供上下文持久性。
常见的系统架构包括:ReAct(推理-行动)架构,LLM动态选择并调用工具,形成迭代循环,模仿药物发现中的DMTA循环;反思智能体架构,多个LLM相连,可相互沟通与批判,适用于需要讨论和战略规划的任务;多智能体架构,包括具有任务委派功能的监督者架构(模仿研究团队组织)和去中心化的群体架构,后者允许智能体间直接连接协作。
应用领域与案例研究
全面的文献分析用于分子优先排序
在早期临床前药物发现中,全面的文献分析是一项繁琐耗时的任务。一个多智能体框架可转变此过程,通过协调器智能体管理具有特定领域专业知识的子智能体,如专利提取、文献检索和交叉引用智能体,实现自动化分析。例如,在BTK抑制剂发现工作中,该系统可并行评估acalabrutinib的选择性谱与其结构类似物,自动检索专利、提取SAR数据、生成ADMET预测并汇总为结构化报告,将数周工作压缩至极短时间内。
计算机毒性预测
制药和化学工业在毒理学评估方面面临瓶颈。智能体AI系统可将预测毒理学建模与化学信息学结合,实现更安全的化学品设计。例如,Human Chemical开发的采用ReAct架构的系统可用于评估香料成分cashmeran的内分泌干扰风险。系统不仅基于结构进行危害预测,还自动检索其代谢物、评估其各自危害,并结合文献证据(如快速代谢清除率、高NOAEL值)进行暴露评估,综合判断其总体内分泌干扰风险较低。这展示了智能体AI在进行复杂的、跨危害表征和暴露评估的多步骤分析中的效用。
自动化方案设计与执行
设计和验证支持药物发现的检测方法缓慢且依赖专家。智能体AI可通过闭环协调整个检测开发工作流程:检索文献、推理实验设计、生成方案、产生可执行的实验室指令,并根据结果迭代优化。例如,Potato开发的Tater多智能体系统,在接到“为Opentrons平台开发用于AAV定量的qPCR自动化方案”任务后,可在2小时内生成经过筛选的文献集、检测参数对比表、完整的MIQE标准对齐方案以及可执行的液体处理代码,将原本需要1-4个月的设计周期压缩了超过400倍。
虚拟科学家加速药物发现
药物发现工作流程通常在生物学、化学和临床领域间割裂。Kiin Bio的“虚拟科学家”多智能体AI平台集成了超过100种工具和AI模型,能够提议、评估和优先排序计算机和实验室实验。在特发性肺纤维化(IPF)的临床前药物发现项目中,虚拟科学家们协同分析了公共组学数据、文献、RNA-seq数据、结构模型并生成化学分子,在不到2小时内输出了疾病全景综述、排序的组学数据集以及初步的小分子候选物,而手动在不同系统间进行通常需要2-3周。
罕见病的药物重定位
罕见病研究因患者群体小、数据稀缺而受阻。智能体系统可自动化端到端的药物重定位流程。Augmented Nature开发了一个基于监督者架构的系统,针对脊髓性肌萎缩症(SMA)等疾病,并行启动疾病、通路、蛋白、化合物和安全性智能体,在约30分钟内从集成的八个数据库中筛选出最终的排名候选药物,而手动方法需要数周。这为加速罕见病的早期发现提供了强大且可扩展的工具。
自动化小分子合成
候选化合物的合成常是小分子发现中的限速步骤。智能体AI可同时解决合成路线规划和自动化执行两大难题。onepot.ai等系统将硬件自动化(如液体处理器、LC/MS)与用于文献搜索、逆合成和代码执行的虚拟工具相结合,形成一个结合虚拟和物理组件的“AI科学家”,能够设计并执行小分子合成实验,每天合成数十个化合物,显著加速了受“合成”步骤制约的迭代周期。
发现到交易的决策
生物医药资产发现对制药公司至关重要,但早期发现受制于手动、碎片化的流程。Convexia Bio开发的智能体工作流可自动化端到端的资产发现、评估和战略包装。系统涵盖资产发现、科学评估、市场分析、临床评估和成功率评分五个模块,将所有分析、假设和数据源记录在案,用于透明的继续/终止决策。一家中型制药公司使用该系统在数小时内完成了产品组合筛选和候选药物选择,成本更低且数据覆盖更广。
挑战与未来方向
尽管前景广阔,智能体AI在药物发现中仍面临挑战:
- 1.
数据和知识异质性:化学和生物数据具有高度条件依赖性,且实体存在多种表示方式,导致系统级不兼容,需要大量工程努力进行映射和标准化。
- 2.
隐私与安全问题:高度自主的系统可能自主访问、操作敏感数据,而闭源LLM的不可审计性加剧了风险。提示注入攻击等安全威胁也构成严重隐患。
- 3.
幻觉风险:LLM的非确定性可能产生不存在的化合物、临床试验或机制解释,在药物发现中可能导致数月实验资源浪费,甚至危险实验。必须坚持人在回路和流程透明。
- 4.
基准测试局限:当前基准多关注智能体输出结果,而非导致该结果的推理或工具调用轨迹。需要开发能评估中间步骤的基准,并确保评估置于真实世界复杂性(如体内环境)的适当应用背景下。
未来发展方向包括:
- •
闭环的自驱动药物发现:自驱动实验室执行闭环实验,实现24/7的自动化设计-合成-测试-分析循环,加速分子优化。
- •
虚拟实验室与数字孪生:通过数字孪生(物理系统的虚拟实时映射)在虚拟空间中预筛选和优化实验,再将最有希望的方案投入湿实验,形成数字-物理闭环系统。
- •
人类副驾驶与民主化创新:智能体AI将把科学家从常规任务中解放出来,专注于创造性设计、解释和战略决策,形成人机协作伙伴关系。同时,预计将出现类似于良好实验室规范的新工业标准和法规,以规范AI设计实验。
结语
药物发现中的AI智能体已显示出显著潜力,在降低成-本、加速时间线和提高成功率方面前景广阔。从文献综合到端到端决策,多个案例展示了智能体AI如何将传统上数月的工作流压缩至数小时,同时保持科学可追溯性。展望未来,成功部署需应对数据异质性、系统可靠性、隐私和基准测试等挑战。随着适当治理框架和工业标准的成熟,智能体AI系统将不是取代人类专业知识,而是增强它,从而推动创新民主化,实现最终造福全球患者的加速、高成本效益的药物发现。