利用新兴的多模态模型提升癫痫药物反应预测能力:重点关注临床、药理学和基因组因素

时间:2026年5月18日
来源:CNS Drugs

编辑推荐:

摘要 癫痫是一种常见的神经系统疾病,尽管抗癫痫药物(ASMs)的数量呈指数级增长,但仍有大约三分之一的患者发展为药物难治性癫痫。目前,抗癫痫药物的选择主要基于经验,缺乏可靠的生物标志物来预测治疗反应。药物基因组学是影响药物反应的重要因素。开发包含基因组信息的癫痫药物反应预测模

广告
   X   

摘要
癫痫是一种常见的神经系统疾病,尽管抗癫痫药物(ASMs)的数量呈指数级增长,但仍有大约三分之一的患者发展为药物难治性癫痫。目前,抗癫痫药物的选择主要基于经验,缺乏可靠的生物标志物来预测治疗反应。药物基因组学是影响药物反应的重要因素。开发包含基因组信息的癫痫药物反应预测模型仍处于早期阶段。人工智能(AI)和深度学习(DL)的进步为多模态建模提供了新的机会,特别是能够同时考虑患者的基因组风险因素和临床特征(如癫痫类型、磁共振成像[MRI]/脑电图[EEG]结果的模型)。更广泛地说,新技术正在推动向“主动AI”的范式转变,即决策支持代理将协调医疗信息并提出行动建议。这些进展对癫痫的个性化抗癫痫药物处方具有重要意义。例如,深度学习模型可以使用从在大型图谱上训练得到的AI基础模型压缩表示的数据进行操作,从而增强对小型癫痫群体的处理能力,而无需建模数千个基因变异。在这篇综述中,我们总结了新兴技术如何被利用,并强调了提升能力的策略。我们特别关注临床、药理学和基因组数据,讨论了如何格式化药物信息以充分利用深度学习模型的能力。我们描述了AI基础模型,并提供了它们在癫痫研究中的应用示例。最后,我们总结了当前面临的挑战,包括模型评估、数据可用性、伦理考虑以及临床转化的障碍。

关键词
- 用于预测个体治疗的AI模型正在迅速发展。
- 我们已经证明,能够同时处理临床和基因组数据的模型对临床护理具有变革性影响。
- 未来,AI模型将使为患者匹配最有效的抗癫痫药物变得更加容易。
- 要实现变革性进展,需要合作和标准化的数据收集,以扩大样本规模,并采用方法创新来充分发挥技术的潜力。

1. 引言
癫痫是全球常见的慢性神经系统疾病,普通人群中的患病率约为千分之一[1]。全球有超过5000万人患有癫痫,导致1300万伤残调整生命年[1, 2, 3]。反复发作可能导致身体损伤以及心理社会和认知功能障碍,而学习障碍和精神疾病等共病情况会加重癫痫的管理难度。癫痫患者的早死率较高,包括癫痫引起的突然意外死亡。
抗癫痫药物(ASMs)仍然是癫痫的主要治疗手段。过去20年中,市场上可用的抗癫痫药物数量显著增加,目前已有超过25种[4]。然而,这些新药物并未显示出比旧药物更好的疗效。药物难治性癫痫的比例一直稳定在约30%[5, 6]。目前,抗癫痫药物的选择主要基于经验,缺乏可靠的生物标志物来预测治疗反应。包含基因组信息的癫痫药物反应预测模型仍处于发展初期。人工智能(AI)和深度学习(DL)的进步为多模态建模提供了新的机会,特别是能够同时考虑患者的基因组风险因素和临床特征(如癫痫类型、磁共振成像[MRI]/脑电图[EEG]结果的模型)。更广泛地说,新技术正在推动向“主动AI”的范式转变,即决策支持代理将协调医疗信息并提出行动建议。这些进展对癫痫的个性化抗癫痫药物处方具有重要意义。例如,深度学习模型可以使用从在大型图谱上训练得到的AI基础模型压缩表示的数据进行操作,从而增强对小型癫痫群体的处理能力。在这篇综述中,我们总结了新兴技术如何被利用,并强调了提升能力的策略。我们特别关注临床、药理学和基因组数据,讨论了如何格式化药物信息以充分利用深度学习模型的能力。我们描述了AI基础模型,并提供了它们在癫痫研究中的应用示例。最后,我们总结了当前面临的挑战,包括模型评估、数据可用性、伦理考虑以及临床转化的障碍。

2. 临床特征
用于描述患者癫痫的典型临床特征包括人口统计信息和医疗历史,如癫痫类型、治疗开始时的年龄以及治疗前的发作次数。其他相关的临床信息可能包括智力障碍、精神疾病、热性惊厥史、儿童中枢神经系统感染、严重头部创伤、缺氧损伤或脑血管疾病。生活方式因素,如酒精或物质滥用,以及一级亲属中的癫痫家族史也被用作输入变量。诊断测试结果,特别是脑电图(EEG)或磁共振成像(MRI)发现,也可以进一步补充临床特征[18, 21, 22]。Silva-Alves等人[22]应用的ML方法发现,通过MRI检测到的海马硬化是区分对抗癫痫药物反应不佳的内侧颞叶癫痫患者的最佳参数。MRI发现是结合基因组和临床特征的模型中的主要临床贡献因素[21],也是Hakeem等人[18]早期研究中使用相同临床特征预测个别癫痫患者对抗癫痫药物反应成功的主要因素。Wang等人[23]描述了通过结合EEG复杂性和15个临床特征来预测新诊断癫痫患者奥卡西平治疗结果的分类器。

3. AI和机器学习
人工智能(AI)是指机器模仿人类智能思维和学习的能力。AI在医学领域有广泛的应用潜力,包括减少错误、简化工作流程和减少人力资源需求。早在20世纪70年代,人们就开始探索AI在辅助临床决策中的应用,当时设计了MYCIN作为临床决策支持系统软件来帮助管理细菌感染[9]。
机器学习(ML)是AI的一个分支,有助于解决许多复杂问题。ML大致可分为监督学习和无监督学习。在监督学习中,使用带有标签的训练数据集来训练ML算法。k-最近邻(kNN)和随机森林是常见的监督学习示例。无监督学习不需要在模型训练中预先选择潜在的预测变量,而是可以从原始数据中提取特征,识别隐藏的模式和关联。深度学习是一种更高级的ML类型,其算法结构采用多层人工神经网络的形式。输入以非线性方式通过人工神经元层并映射到输出[10]。根据数据类型,应用特定的深度学习架构来最好地学习隐藏特征,例如用于图像的二维卷积神经网络(2D-CNN)和用于脑电图(EEG)及可穿戴设备生物信号的1D-CNN和变换器模型[11, 12]。随着训练数据量的增加,可以增加层数以捕捉数据的复杂性并提高性能。
近年来,出现了几种专门针对基因组信息和治疗反应预测的ML工具。2017年引入的变换器模型具有自注意力机制,使它们能够决定哪些输入信息最重要。这种能力使它们能够更有效地捕捉数据中的上下文、意义和长期关系[13]。大型语言模型(LLMs)是基于语言的技术,通常采用变换器架构[14]。在基因组学中,DNA序列(称为k-mer)被标记为“单词”输入模型,然后可以训练模型来识别对基因调控重要的区域,并预测基因变异对这些位点调控活动的影响[15]。检索增强生成(RAG)框架通过动态访问外部知识扩展了LLMs的推理能力,从而能够从可信来源进行简洁的综合。这种方法特别适合于临床解释基因变异,因为必须整合多种研究方法的功能效应证据[16]。
这些进展共同促成了基础模型的出现。基础模型通常在非常大的数据集上训练,采用自监督学习方法,并可以适应许多不同的下游任务[17]。特别是基于DNA和RNA序列数据的基础模型,对于预测个体对药物的反应非常有趣。

4. AI在医学建模中的应用
AI在多个复杂生物医学输入上进行推理和预测的能力开启了医学建模的新时代。利用这项技术预测个体患者对抗癫痫药物的反应是当前研究的重点。一个基于回顾性临床信息预测新诊断癫痫患者对抗癫痫药物反应的深度学习模型证明了这种方法的可行性[18](表1)。一项多中心、前瞻性、双盲、随机、对照试验正在开展中,以评估这一模型[19]。另外三项研究的结果表明,在基因组和临床信息上训练模型可以提高预测能力[20,21,22]。目前,结合临床、药理学和基因组数据的癫痫多模态建模仍处于起步阶段。为了提升能力,本文深入探讨了数据表示技术和相关新兴技术。我们进一步讨论了挑战,包括数据可用性、模型评估、伦理考虑以及临床转化的障碍。

表1 使用临床和基因组数据预测癫痫药物反应的研究例如,Feng等人[21]采用了一种混合方法,其中使用假设驱动的方法来选择感兴趣的基因和变异体,并通过Transformer模型架构中的注意力头进一步进行特征选择。这样,先前的生物学知识限制了输入空间,同时模型保留了识别可能未预先指定的高阶相互作用和特定上下文关系的灵活性。通过使用Shapley Additive exPlanations(SHAP)分析来量化临床变量的相对贡献,这是一种解释模型预测的统一方法[24],不仅提供了对这些模型的洞察,也有助于我们理解对ASM的反应性。例如,Hakeem等人[18]和de Jong等人[20]都一致地确认了精神疾病和发作频率在药物反应性中起着重要作用。

3. 基于药物的特征
3.1 分子特征
药物名称通常被用作预测模型中的输入。然而,深度学习模型可以处理药物的复杂分子表示,包括捕捉原子和键之间关系的图形网络,这是一个经常被忽视的提高模型性能的机会。关于药物的信息可以以多种不同的方式封装和格式化。格式的选择取决于模型架构和研究问题。一种基本方法是使用药物名称或简单的数字编码,如Feng等人[21]采用的0和1的向量(one-hot编码)。可以使用称为“分子指纹”的化学描述符来包含更多信息。这些指纹以一致的数值或位串表示形式捕捉化学物质的属性(例如原子和键、功能基团或化学基序的存在),计算成本较低,因此非常适合机器学习[25]。常见的类型包括PubChem、Molecular ACCess System、Mini FingerPrint和SMILES FingerPrint[26,27,28,29]。描述符可以直接作为模型的输入,例如使用简化的分子输入行系统(SMILES)[30]。它们也可以用来生成从简单分数(表示分子合成的难易程度)到为特定研究问题优化的复杂表示的各种模型输入[31]。例如,为了预测药物与离子通道的相互作用,Zheng等人[32]使用word2vec算法从SMILES生成了新的描述符来生成词嵌入。Huang等人[33]使用了三种不同的分子指纹来全面表征不同粒度的分子,以输入到基于CNN的架构中。深度学习方法SubCDR[34]的开发者设计用于预测癌症药物耐药性,他们使用破坏逆合成感兴趣的化学子结构(BRICS)的方法从SMILES中提取重要子结构(子组件),并使用扩展的连接指纹(ECFPs)格式构建特征向量。ECFPs是一类拓扑指纹,最初是为子结构和相似性搜索开发的,可以表示无限数量的分子特征,具有很高的通用性[35, 36]。3D指纹编码了3D形状特征,如原子坐标、键角和药效团的空间排列:药效团是负责生物或药理活性的化学部分,包括与目标分子的相互作用。3D指纹已被证明有助于识别与现有药物具有相似活性的化合物,或模仿天然存在分子(如激素,类似药物)的活性[37, 38]。Khan等人[39]使用先进的3D结构描述符研究了药物结构对癌细胞基因表达的影响。还有一种4D指纹形式,其中包括一种方法参数,其中定量3D模型(例如构象、对齐和原子类型)作为方法参数的函数进行优化[40]。这种方法已被用于药物再利用分析和预测化学化合物引起的皮肤敏感化等任务[41, 42]。
基于图的表示可以捕捉当药物表示为字符串时可能丢失的结构信息。RDKit是一个开源的化学信息学软件,可以将SMILES转换为反映药物内原子之间相互作用的特定于药物的分子图[43]。这种表示可以与卷积网络架构一起使用,并已应用于预测抗癌药物的反应性[44]。
在癫痫ASM反应预测的背景下,分子指纹的实用性仍有待全面探索。SMILES已被用于一项研究,利用MRI扫描和报告来研究ASM结果预测[45]。分子指纹可能在相关研究任务中具有潜在的实用性,例如在计算机模拟中检测药物-药物相互作用,或在诱导多能干细胞(iPSC)衍生的癫痫细胞模型中选择化合物进行治疗评估。

3.2 药物协同作用
在癫痫的治疗中,经常使用两种或更多种ASM的联合疗法。AI已被用于预测协同药物相互作用,主要在癌症领域[46, 47]。DeepSynergy使用化学和基因组特征作为多层感知器模型的输入来预测协同药物组合[48]。SYNDEEP利用深度神经网络架构和更广泛的输入特征集,包括蛋白质-蛋白质和蛋白质-代谢物相互作用,以及Morgan指纹计数,后者表示在分子中检测到特定子结构(例如脂肪环和芳香环、H键供体和受体)的次数[49]。DGSSynADR模型使用图结构和图卷积网络(GCN)进行特征提取,以识别抗癌药物组合[50]。SYNDEEP的开发者指出,将药物理化特征与基因组信息结合起来显著提高了模型性能。这些或类似的方法可以用来探索ASM之间的协同作用。

3.3 药物毒性
像大多数药物一样,ASM在某些个体中可能会引起严重的不良反应。用于预测化学物质毒性的AI模型有可能被用来评估不良反应的风险,或将这些上下文信息纳入药物反应预测模型中。化学空间网络(CSNs)是随机图,允许评估网络组织,如枢纽和社区以及度数和特征向量中心性等指标,在预测毒性和设计更安全的药物方面具有有希望的实用性[51]。这些模型预测毒效团,也称为结构警报,将化学片段与毒理学终点关联起来。人们认为这些图表示优于未能利用数据成对关系的传统方法[52]。例如,Amoroso等人[51]使用CSNs分析发育毒性(由于暴露于有害物质而导致后代异常发育)的网络拓扑,并评估社区内的毒效团是否共享特定的药物靶点。从684种有毒和135种无毒化学物质生成的图包含三个不同的社区,其中一个社区主要由巴比妥酸盐、海丹妥因和氨基醇等常用ASM组成。作者建议,从这个模型中得到的特征可以与理化描述符和指纹结合起来,以增强与毒性相关的建模。Mastrolorito等人[52]使用CSNs为假定的毒性提供可解释的结果,包括发育毒性、皮肤刺激和肝毒性,所有这些都与ASM有关,模型架构阐明了与给定毒性相关的结构改变。
替代方法包括一种增强的GCN模型,它消除了对预定义分子描述符和指纹的依赖,以及一种基于片段的图变换器网络,用于预测生殖毒性[53, 54]。总体而言,这项技术仍处于起步阶段,预计会有进一步的改进。在癫痫中,结合不同毒性的ASM和药物进行建模可以阐明通向研究遗传风险的道路,以了解对药物如智商降低和其他致畸效应的细微和复杂不良反应。

4. 基于基因组的特征
将DNA测序数据纳入AI建模是具有挑战性的,因为人类基因组中存在大量的核苷酸碱基和许多不同的特征类型。一个重要的考虑因素是DNA序列的功能是动态的并且高度依赖于上下文,这意味着遗传变异的功能后果取决于组织类型和特定细胞类型的活动等因素,例如,某些编码的蛋白质对一种组织是必需的,但在其他组织中功能上是良性的。就基因调控而言,变异的后果也取决于细胞环境中的条件,这意味着某些生物机制只有在某些刺激(如药物暴露)存在的情况下才会发生并对遗传变异敏感。在这种情况下,修改表型特征的变异体通常被称为表达数量性状位点(reQTLs)。这种上下文细微差别和复杂性挑战了选择DNA序列作为预测模型输入的任务。DNA本质上是无上下文的:A、C、G和T字母的顺序在身体的每个细胞中都是相同的,单独的DNA序列本身并不传达它们在特定组织或细胞类型中可能如何发挥作用的任何信息。
目前的一种常见策略是晚期整合,即使用来自全基因组关联研究(GWASs)的DNA信息来寻找在通过其他模式(特别是其他组学数据类型)阐明的特定基因或通路中的变异富集。例如,Wamsley等人[55]通过使用单核RNA测序和来自死后脑组织的转座酶可访问染色质的单核测定,首先识别自闭症谱系障碍患者大脑中发生的变化与遗传易感性的关联,然后确定这些调控子基因与SFARI Gene Module数据库中报告的与自闭症谱系障碍相关的基因的重叠,该数据库汇编了来自已发表文献的证据。为了更充分地利用AI的力量,需要早期整合方法,使算法能够同时学习和推理DNA和其他数据模式的信息。这需要最佳的方式来选择用于建模的变异谱,或与相关上下文信息的整合,以便模型能够在数据中找到生物学上有意义的模式。
降维是一个重要的预建模步骤。到目前为止,包括基因组特征在模型中预测ASM反应的研究采用了基于知识的策略来限制分析的变异数量。这包括选择影响感兴趣的基因集的变异体,例如与癫痫和ASM的药物基因组学相关的基因、参与特定生物通路的基因或基因本体术语相关的基因,或与作用机制相关的基因[20]。
Petrovski等人[56]提供了癫痫多基因药物组学建模的早期示例。他们开发了一个多单核苷酸多态性(multi-SNP)分类器来预测新治疗癫痫的ASM结果。使用279个候选基因中的4041个SNP的基因型,他们根据Golub评分对SNP与治疗结果之间的关联进行了排名。最终,选择了五个SNP作为模型的输入——SCN4B中的两个,GABBR2、SLC1A3和KCNQ1中的各一个。在多SNP模型中使用了kNN算法,实现了83.5%的交叉验证预测准确性,优于任何单一SNP模型在两个验证队列中的表现。
Shazadi等人[57]随后在另一个国家两个大型独立队列中评估了同一多SNP模型的泛化能力。直接验证效果不佳,模型未能预测验证队列中的治疗反应。然而,在验证队列内的留一法交叉验证显示,相同的五个SNP组合对于接受卡马西平或丙戊酸治疗的患者仍然具有预测能力,但对于接受其他ASM的患者则没有。这表明,虽然原始模型不能直接在人群中泛化,但底层的SNP面板可能具有值得进一步探索的药物特异性预测能力。Silva-Alves等人[22]选择了11个药代动力学相关基因内的变异体。Feng等人[21]基于已知或预测的变异的功能后果生成了基因组特征。de Jong等人[20]评估了38个基因集特征的预测性能,这些特征基于药物靶向的特定受体的变异负担,以及多基因风险评分特征。

4.1 多基因风险评分
多基因风险评分代表了与表型(包括药物基因组学表型)相关的变异的累积效应,基于GWAS的结果。多基因风险评分被认为是预测药物反应的合适数据简化方法,因为像许多复杂疾病一样,大多数药物反应很可能是高度多基因的。然而,也必须考虑到药物反应是一个具有异质性决定因素(例如吸收、代谢或药物靶点基因的变异)的复杂表型,这些因素可能会稀释遗传信号。生成多基因风险评分的方法已经从简单的统计每个个体的风险等位基因数量的方法发展到考虑每个变异对表型贡献程度的变化、由于谱系不平衡导致的SNP之间的相关性以及明确建模因果效应的贝叶斯回归方法[58, 59]。在药物基因组学中,多基因风险评分分析的一个关键挑战是用于汇总统计(效应大小、标准误差和p值)的基础队列主要是基于疾病的。从疾病相关基础队列得出的多基因风险评分可能无法完全代表药物反应的遗传性,一个具体的例子表明,任何从疾病全基因组关联研究(GWASs)中开发出的多基因风险评分最多只能解释低密度脂蛋白胆固醇反应的46%的变异[59]。由于这类研究的可用性较低,从药物基因组学研究中开发多基因风险评分面临挑战[59]。模拟研究表明,结合使用来自疾病相关基础队列的风险评分和来自药物基因组学特定研究的预测能力的方法可以提高预测准确性。这种组合方法或单独使用任一基础队列哪种更好尚不清楚,最终将取决于数据的可用性[59]。多基因风险评分本质上是依赖于人群的,当样本量较小时,这一限制会加剧。缺乏非欧洲人的GWAS数据意味着跨人群预测也具有挑战性。为疾病相关多基因风险评分开发的跨种族分析方法可以应用于提高性能[59]。从多种相关疾病类型构建的多基因风险评分,以及包括统计显著性较低的SNP(基于高显著性阈值选择,p值<5×10^-8)也可能提高性能[58, 59]。为了生成多基因风险评分作为其预测模型的输入特征,de Jong等人[20]使用了从PheWAS Catalog获得的与癫痫表型相关的SNP的汇总统计信息。虽然没有报告多基因风险评分特征如何贡献于模型,但根据他们最佳模型的SHAP分析,最强的基因组特征预测因子是与其研究药物(brivaracetam)靶向的SV2A受体重叠的变异的存在,这会负面影响反应概率,以及一组与微管结合相关的基因本体(Gene Ontology)基因,这会正面影响反应。

4.2 功能后果
Silva-Alves等人结合了56个SNP和临床变量,将随机森林算法预测耐药内侧颞叶癫痫患者药物反应的准确性从0.4568(仅使用临床变量)提高到了0.8177[22]。这项研究关注影响药物代谢和转运的SNP,并发现CYP1A2基因中的一个SNP是预测模型中最重要的变量。Feng等人[21]采用了另一种方法,根据证据选择影响基因表达的变异(基于eQTL数据)或修改在基因调控中起关键作用的转录因子的结合亲和力的变异,其理由是这些机制介导了细胞对药物暴露的反应,并且可能对reQTLs敏感。他们使用了一个已发布的AI工具来生成分数,表示一个变异影响515个转录因子中一个或多个的结合亲和力的可能性,使用这些分数构建的特征在与临床信息结合建模时提供了最佳的预测性能。总体而言,这些发现证实了变异负担的总和是一种有用的方法,并且尝试不同的子集选择方法可以揭示出强有力的预测因子。

4.3 输入格式和模型架构
与药物信息一样,基因组信息也可以以不同的方式格式化以优化模型性能。许多设计用于预测癌症药物反应的模型将体细胞变异编码为1表示突变,0表示野生型,而生殖系基因型通常编码为0表示非携带者,1表示杂合携带者,2表示纯合子。这些总和值可以用来构建矩阵,例如包含单个基因或基因集的负担[20, 22]。根据模型架构,可以实现噪声减少和进一步的特征选择。例如,具有注意力机制的Transformer模型允许模型在产生输出时动态关注并权衡输入中不同数据点的重要性,从而抑制无关数据[60, 61]。Li和Kalofonou[62]通过引入t分布随机邻居嵌入方法来提高癌症药物反应预测的性能,以降低深度神经网络架构中的DNA突变和拷贝数信息的维度。

生物系统本质上是相互连接的,基因/蛋白质复合体或增强子区域与启动子区域之间的相互作用会产生组合效应。这些相互作用可以封装在图/网络中用于基于图的建模。基于图的模型已被应用于癌症领域来预测药物反应[44, 63, 64]。

5 多模态数据资源
在癫痫研究中,AI模型主要使用来自患者队列的数据进行训练和测试。通常会将不同的队列合并以增强统计能力或用于测试模型的泛化能力。在癌症领域,大规模公共多模态数据语料库的构建推动了建模技术的创新[65,66,67]。特别是在神经科学领域,PsychENCODE联盟建立了一个数据汇编,以增强预测DNA非编码区域基因组变异的修改效应的能力,并提高对其如何导致精神障碍的理解[68]。这一基础设施为癫痫研究的能力建设提供了战略和方法指导。从2000多个人类死后脑样本中分析了表观遗传和转录组景观,涵盖了多种脑区和病理状态。识别出了数万个包含在大脑中活跃的基因调控元素的DNA区域。该数据汇编包括单细胞水平的数据、胎儿发育不同阶段的谱型,以及探索抗精神病药物在人脑中的分子效应的数据[69, 70]。

6 基础模型
来自单细胞RNA测序的庞大数据档案,即单细胞转录组学,使模型能够学习所谓的“细胞语言”[71]。这些资源被用于开发基础模型,这是一种学习通用生物学表示的模型,进而可以应用于更具体的主题模型[72]。类似地,基于全基因组功能基因组学数据训练的模型可以超越训练数据集进行泛化应用。这是因为通用知识作为嵌入被捕获在基础模型中,可以用作各种下游任务和研究问题的主题特定模型的输入。从基础模型中获取知识(学习到的特征、权重、表示)并将其应用于相关任务的方法是一种迁移学习。在癫痫研究中,基础模型可以用来优先考虑用于诊断或预测建模的基因变异,例如,通过识别变异将对哪些细胞类型(神经元或胶质细胞)产生最大影响的细胞类型,或生成代表变异对调控机制影响的分数,或提取预训练的嵌入作为基因组特征。

scFoundation模型在超过5000万个单细胞RNA测序数据上进行了预训练,以建模19,264个基因,具有约1亿个参数[71]。编码器的输出被汇总成细胞级嵌入,用作组织癌症药物反应预测和单细胞癌症药物反应分类的基因表达谱的替代品[71]。Geneformer基础模型被训练用于识别特定于上下文的基因网络,以实现特定于上下文的预测,其中每个输入基因被嵌入到一个256维的空间中,该空间编码了每个输入细胞特定环境的基因特征[73]。scGPT是一种生成式基础模型,它在自然语言处理和细胞生物学建模之间建立了联系[74]。生成模型旨在预测序列中的下一个标记,例如预测给定句子中空白处的正确单词,或在生物学背景下预测蛋白质序列中的氨基酸[72]。类似地,scBERT将基因视为标记,将细胞视为句子,并在100万个未注释的单细胞RNA测序数据上进行了预训练,用于下游细胞类型注释任务[75]。GenePT利用ChatGPT对基因的嵌入,基于文献中对单个基因的文本描述,并声称其性能可与基于数据的模型(如Geneformer和scGPT)相媲美甚至更好[76]。针对DNA数据,Enformer基础模型被训练用于从基因组DNA序列预测染色质状态和基因表达。这涉及预测增强子-启动子相互作用[77]。Dalla-Torre等人[78]开发了Nucleotide Transformer,它包含在3202个多样化的人类基因组和850个不同物种的基因组上预训练的多个基础模型,具有5亿到25亿个参数。这些模型可以低成本地进行微调,用于特定的下游任务,并用于迁移学习。

在机器学习中,“零样本”一词指的是模型在预训练期间学到的先验知识应用于未见过的任务的能力。一个例子是在没有看到特定任务的标记示例的情况下进行预测。零样本分数用于衡量模型在预测其未训练过的任务方面的表现,基于嵌入比较(例如嵌入之间的余弦相似性)。例如,在遗传变异分类(良性与可能有害)中,模型没有被训练来预测类别,而是被训练来生成代表核苷酸序列上下文的嵌入。然而,从野生型和突变DNA序列中学到的差异可以用来作为后者功能后果的代理。这是通过嵌入包含变异的DNA序列,并根据这些数据以及原始野生型数据生成的嵌入的变化来生成分数来实现的。Nucleotide Transformer的作者使用这种方法展示了Multispecies 2.5B模型的良好性能,其在ClinVar数据库中注释为致病的遗传变异的接收者操作特征曲线(AUC)下面积为0.80[78]。这种方法可以用于在输入到AI引导的ASM处方之前细化多基因风险评分或其他变异分组。

比较来自eQTL变异的零样本分数和与DNA甲基化相关的(称为meQTLs)分数,发现仅在人类序列上训练的模型表现最佳。相比之下,在多物种模型中,同义变异以及蛋白质破坏性变异(例如错义和终止获得变异)的识别性能更好。这一观察结果很有趣,因为同义变异长期以来被认为是不活跃的,并且在变异清理流程中经常被过滤掉,尽管它们越来越多地被证明与疾病有关。据报道,它们还具有其他功能效应,包括修改药物反应[79]。例如,ABCB1/MDR1基因中的同义变异与多药耐药性有关,具有微妙但功能重要的效应,这些效应难以用标准检测方法检测到[80]。Nucleotide Transformer识别具有功能重要性的同义变异的能力可以改进当前依赖于基于知识的注释或统计频率的变异选择方法。

总之,基础模型在巨大的图谱上进行了训练,提供了生物学上合理的状态的学习。在转录组学中,它们学习了包括基因-基因共调控结构、细胞状态(例如胶质细胞激活状态形成梯度,正常神经元状态占据结构化区域)和调控层次结构(发育轨迹形成弧线)的模式。来自癫痫患者的细胞可以通过这些预训练的嵌入来检测与典型景观的偏差。这使我们能够提出诸如以下研究问题:(1)局灶性和泛发性癫痫在与相同基础模型嵌入相比时是否表现出根本不同的变化,或者是否存在趋同的路径;(2)嵌入变化是否与发作频率相关,或者与药物耐药性有关。从基因组学的角度来看,我们可以比较药物反应性和药物耐药性患者之间的变异后果预测分数模式,或者确定局灶性癫痫患者是否对特定增强子有更强的破坏作用,而泛发性癫痫患者则表现出广泛的神经元调控紊乱。这些问题不仅对构建用于建模的基因组特征有影响,也对治疗策略或患者分层试验具有重要意义。此外,深度学习模型处理高维数据压缩表示的能力提高了对小规模癫痫队列的分析能力。因此,即使基础模型不是专门为癫痫训练的,也可以间接支持癫痫研究。

模型性能
与所有技术进步一样,模型架构和方法的发展速度超过了有效评估的能力。透明报告个体预后或诊断的多变量预测模型(TRIPOD+AI)检查表是一种工具,可帮助作者以一种让政策制定者、最终用户和患者理解AI驱动研究的数据、方法、发现和结论的方式报告研究结果[81]。重要的是,TRIPOD+AI指南优先考虑通用性,明确鼓励外部和时间验证,而不是简单的随机分割。它还要求报告区分度、校准和临床效用。在使用AI工具进行临床决策(例如,在治疗开始时指导抗癫痫药物选择)时,准确的概率估计是必不可少的。此外,为了迈向前瞻性验证,除了传统的性能指标(AUC、特异性、精确度和F1分数)之外,还应包括决策曲线分析来评估预测模型的性能。最重要的是,性能指标必须根据临床相关的癫痫结果进行情境化。在预测抗癫痫药物反应时,仅凭AUC是不够的,还需要高精确度来减少无效处方的“试错”负担。校准分析(例如校准图、Brier分数、预期校准误差)评估预测概率是否准确反映了观察结果,这对于基于风险的决策至关重要。决策曲线分析进一步评估了模型在一系列阈值概率下的净临床效益,展示了其使用是否比标准策略(例如全部治疗或不治疗)能改善治疗决策。在选择性能指标方面没有普遍的标准。尽管接收者操作特征曲线(AUROC)下的面积常用于评估机器模型,但在数据集不平衡的情况下可能会产生误导。理想情况下,模型应同时具有敏感性和特异性,但实际上通常需要通过阈值选择来权衡。

在癫痫领域,有时需要一个高敏感性的模型,例如在预测癫痫猝死(SUDEP)方面。可以识别出有SUDEP风险的患者并采取挽救生命的预防措施。然而,在预测药物耐药性癫痫的情况下,特异性可能更为重要,因为阳性预测的病例可能会触发昂贵或侵入性的检查。因此,虽然模型开发者应尽可能全面地提供性能指标,但读者应根据临床背景批判性地解读这些指标,而不仅仅是浏览表面数字。

临床解读:即使看似微小的预测改进,例如在识别可能实现无发作状态的患者方面提高5%,也可能具有临床和经济意义。癫痫与显著的发病率、超额死亡率和社会成本相关,对澳大利亚工作年龄段的癫痫人群进行建模表明,将无发作状态从大约70%提高到75%,绝对增益为5%,可以在一生中节省数十亿美元的生产力。将无发作状态提高10%至80%,估计可以防止大约1600例过早死亡,并节省超过10亿美元的医疗保健费用,同时带来数十亿美元的生产力增长[84]。在这种情况下,即使预测准确率提高5%,如果能够转化为更早和更合适的治疗分配,也可能显著减少控制发作的时间,降低累积的医疗保健成本,并在人群层面提高生存率和生活质量。

Hakeem等人[18]的研究仅依赖临床变量来预测治疗结果。训练和验证之间观察到的性能下降表明,临床因素本身可能是异质的、重叠的,不足以捕捉癫痫的全部生物学复杂性。虽然这些变量反映了已知的预后决定因素,但它们可能只代表了驱动治疗反应的潜在疾病机制的部分视图。结合额外的模式,如基因组数据、定量EEG特征或原始神经影像输入,可以提供互补的生物学信号,并通过捕捉常规临床描述符无法观察到的变异性维度来提高通用性。持续观察到大约三分之二的新诊断癫痫患者使用当前可用的抗癫痫药物能够实现持续的无发作状态,这表明可能存在一个治疗平台期,因为尽管几十年来药物学创新和分析方法日益复杂,这一比例仍然相对稳定。如果这反映了潜在的生物学限制而不是建模的局限性,那么更复杂的算法本身可能不会增加响应者的绝对比例。然而,即使在潜在的上限内,通过精确分配和重新定义成功指标,仍然可以实现有意义的改进。机器学习可能无法将总体缓解率提高到66%以上,但它可以显著提高谁更早接受正确治疗的机会,从而缩短控制发作的时间,减少无效药物的暴露,并限制累积的不良反应。在这种情况下,临床进展不是通过超越人群层面的上限来衡量的,而是通过优化治疗轨迹和增强以患者为中心的结果来衡量的,例如更快的缓解、更低的复发风险、减少的发作负担和改善的生活质量。

Feng等人[21]将他们最好的模型应用于新诊断癫痫的100名随机选择的参与者。这表明,如果所有患者都按照模型排名最高的抗癫痫药物作为第一种药物进行治疗,他们预测的平均实现无发作状态的概率(68%)将显著高于队列中观察到的无发作率(47.2%)。尽管是间接的,这种比较意味着该模型可能有潜力帮助临床医生为个别患者选择最有效的治疗。

临床应用
一项开创性的双盲随机试验正在进行中,该试验将评估并为神经科医生选择新诊断癫痫患者的首种抗癫痫药物的有效性提供一级证据[19]。这项研究将提供风险率和预期效应大小的稳健估计,以指导未来的发展,并提供关于采用和易用性的战略见解。在当前医学趋势向主动AI发展的背景下,这类试验至关重要,因为未来的医学将依赖于决策支持代理来协调医疗信息并提出行动建议。Feng等人[21]研究中应用的基因组特征可以轻松适应于临床决策支持工具中灵活包含基因组数据。变异位置(或聚合位置)可以用编号键替换,键和相关分数(代表个性化风险)可以以文本格式上传到基于AI的工具中,避免直接使用敏感的全基因组数据。我们设想了一个未来场景,即患者可以在护理点进行DNA测序,并迅速评估感兴趣的DNA区域内的变异负担。或者,可以通过查询预先测序的数据库来获取所需的基因型,因为各国正在实施新生儿的基因测序[85]。然后可以在“即插即用”的场景中应用基因组特征,将个性化的、特定的预测基因组特征输入到经过训练的AI模型中,以提供针对具体临床问题的建议。

持续观察到大约三分之二的新诊断癫痫患者使用当前可用的抗癫痫药物能够实现持续的无发作状态,这提出了一个治疗平台期的可能性,因为尽管经过数十年的药物学创新和日益复杂的分析方法,这一比例仍然相对稳定。如果这反映了潜在的生物学限制而不是建模的局限性,那么更复杂的算法本身可能不会增加响应者的绝对比例。然而,即使在潜在的上限内,通过精确分配和重新定义成功指标,仍然可以实现有意义的改进。机器学习可能无法将总体缓解率提高到66%以上,但它可以显著提高谁更早接受正确治疗的机会,从而缩短控制发作的时间,减少无效药物的暴露,并限制累积的不良反应。在这种情况下,临床进展不是通过超越人群层面的上限来衡量的,而是通过优化治疗轨迹和增强以患者为中心的结果来衡量的,例如更快的缓解、更低的复发风险、减少的发作负担和改善的生活质量。

Feng等人[21]将他们最好的模型应用于新诊断癫痫的100名随机选择的参与者。这表明,如果所有患者都按照模型排名最高的抗癫痫药物作为第一种药物进行治疗,他们预测的平均实现无发作状态的概率(68%)将显著高于队列中观察到的无发作率(47.2%)。尽管是间接的,这种比较意味着该模型可能有潜力帮助临床医生为个别患者选择最有效的治疗。

一项开创性的双盲随机试验正在进行中,该试验将评估并为神经科医生选择新诊断癫痫患者的首种抗癫痫药物的有效性提供一级证据[19]。这项研究将提供风险率和预期效应大小的稳健估计,以指导未来的发展,并提供关于采用和易用性的战略见解。在当前医学趋势向主动AI发展的背景下,这类试验至关重要,因为未来的医学将依赖于决策支持代理来协调医疗信息并提出行动建议。Feng等人[21]研究中应用的基因组特征可以轻松适应于临床决策支持工具中灵活包含基因组数据。变异位置(或聚合位置)可以用编号键替换,键和相关分数(代表个性化风险)可以以文本格式上传到基于AI的工具中,避免直接使用敏感的全基因组数据。我们设想了一个未来场景,即患者可以在护理点进行DNA测序,并迅速评估感兴趣的DNA区域内的变异负担。或者,可以通过查询预先测序的数据库来获取所需的基因型,因为各国正在实施新生儿的基因测序[85]。然后可以在“即插即用”的场景中应用基因组特征,将个性化的、特定的预测基因组特征输入到经过训练的AI模型中,以提供针对具体临床问题的建议。

持续挑战
数据可用性:模型训练所需的大规模数据引入了技术和伦理挑战。建立合作联盟在后勤和财务上可能具有挑战性,但它们提供了强大的基础设施,是解决小规模队列统计限制的最终解决方案。在癫痫领域,Epilepsy 25(Epi25)是迄今为止最大的全外显子测序研究,包含超过54,000个人类外显子,其中包括来自多个遗传背景组的20,979名深度表型化的患者,这些患者具有不同的癫痫亚型,以及33,444名对照组[86]。未来,全基因组序列数据的收集加上额外的组学数据可以大大扩展能力,并提供关于细胞类型和调控DNA遗传扰动在癫痫中作用的见解。例如,PsychENCODE项目的第二阶段[87]从206名神经精神疾病患者和182名健康对照者的死后前额叶皮层样本中衍生出多组学数据集,从而优先考虑了约250个疾病风险基因和药物靶点及其相关的细胞类型。

缺失数据可能是一个主要限制,特别是对于通常不常规收集的基因组数据。尽管可用性低限制了样本大小,但已证明基因组的包含可以提高癫痫和癌症的预测性能[66]。随着成本的降低,基因组测序在临床环境中的采用可能会随着时间的推移而得到解决。支持数据质量控制和标准化的机构基础设施可以提高数据共享的能力。

伦理考虑:患者同意和隐私至关重要,特别是对于携带重新识别风险的基因组数据,数据保护法律可能会限制数据共享[88]。联邦学习是一种解决方案[61],在这种模式下,原始训练数据分布在各个机构中。在这种情况下,每个数据站点的研究人员使用他们的数据和预定义的超参数(例如批量大小、学习率、层数或注意力头数)训练个别模型参数。然后这些参数被加密并传输到公共服务器,在那里它们被聚合,聚合分析的结果返回给每个参与站点[89]。数据偏差和数据歧视也是在使用基因组数据于机器学习模型时的重要考虑因素。例如,临床预测模型在女性和种族及少数民族中的表现不佳[90]。随着模型通过包含额外模式(特别是那些包含复杂技术如EEG和MRI的模式)而变得更加复杂,资源匮乏环境(本地和全球)中的人员可能会处于不利地位,并进一步被边缘化和排除在科学进步之外,这侵犯了他们的人权[90]。FUTURE-AI国际共识框架为医疗保健中可信和可部署的AI提供了指导。建议涵盖了从设计和数据收集阶段到临床部署的策略。

可解释性:解释模型输出的能力对于临床转化至关重要,因为癫痫的治疗决策直接影响患者的长期结果。虽然SHAP方法广泛用于在表格模型中提供特征级别的归因,但其适用性主要限于结构化的临床或基因组变量。对于学习任意或高维表示的模型,例如从EEG、成像或多模态融合中得出的潜在嵌入,直接归因变得更加具有挑战性,详细的机制解释可能不可行。在这种情况下,可以通过强调可靠性和临床效用而不是仅特征级别解释的补充评估策略来支持信任。

校准分析和决策曲线分析可以帮助展示临床效用,并提供客观的、具有临床意义的证据,即使内部表示不可直接解释,也能支持对AI系统的信心。

药物建模:已发布的模型往往侧重于常用的药物。这可能是由于临床数据的有限可用性。在个性化医学中,可能会忽略一些不常见但有效的选项。大多数现有研究在单个临床时间点评估治疗反应,例如在诊断时早期预测药物耐药性或在预定义的随访时预测无发作状态。尽管一些模型在治疗开始后预测结果,但它们通常依赖于在单个时间点捕获的静态测量值,并不考虑纵向动态。同时,越来越多的证据表明,大脑状态和自主生理在药物给药后随时间演变,表明治疗反应本质上是时间性的[2, 3]。如果有数据可用,明确建模这些轨迹可以改善预测性能,并使临床决策更加及时和知情。

表型变异性:确定癫痫类型和病因的差异如何影响预测建模将非常重要。在冯等人的研究[21]中,通过在新诊断的局灶性癫痫患者和泛化癫痫患者上训练模型,并在另一个独立的新诊断局灶性癫痫患者队列中进行验证,来测试模型的泛化能力。在这两种情况下,多模态方法的表现都优于单模态方法,AUC值相似,且相同的遗传特征带来了最佳的性能。全面的临床特征表示对于构建可靠的癫痫预后模型至关重要。Hakeem等人[18]纳入了16个临床变量,这些变量全面涵盖了已知的与癫痫相关的预后因素,包括发作类型、脑电图异常、神经影像学发现、人口统计特征和治疗相关特征。这些变量反映了先前流行病学和临床研究中确定的治疗反应的核心决定因素。重要的是,深度学习模型不仅限于独立评估这些因素;相反,它还学习了它们之间的复杂非线性相互作用和高阶模式。这使得AI模型能够在不需要手动指定交互项的情况下,捕捉药物类型、年龄、发育背景和其他临床特征之间的隐含关系。因此,与不同ASM(基因变异)、年龄依赖性药理效应和癫痫亚型相关的异质性是通过模型的表示学习过程直接从数据中学习到的。

迄今为止的大多数研究都集中在成人而非儿童群体上。只有少数研究涉及儿童,特别是结节性硬化症复合体[23, 91, 92]。

结论

AI驱动的预测模型的发展是一个快速发展的研究领域。大规模的实验筛选工作应用了多种研究方法,涵盖了组织和细胞类型,包括诱导多能细胞和类器官模型,首次提供了在正常和病理条件下的细胞功能的丰富背景图谱。在AI驱动的DNA序列细胞类型特异性功能预测方面也取得了快速进展,以及遗传变异如何影响功能的研究也取得了进展。能够捕捉基线或正常功能为AI模型提供了关键的“真实依据”。这些新兴的分子基础模型取代了对现有基因注释资源、经典通路信息和公共文献的依赖,后者往往不完整,偏向于研究较为充分的基因(如乳腺癌基因),或者缺乏关于细胞类型特异性功能的信息。

多模态模型具有变革性,允许将临床数据与基因组学信息以及药物化学特性和功能机制的信息结合起来。在癫痫领域,结合临床、药理学和基因组学数据的多模态建模仍处于起步阶段。建立能力需要合作努力,以生成多模态数据存储库,以解决由于样本量小和数据缺失带来的限制。从技术上讲,需要尝试不同的数据表示方法、建模技术(如迁移学习)和基础模型类型(例如Transformer与LLM),以优化预测性能。基础模型可以以以前未预见的方式提供间接支持。需要对模型性能进行稳健评估,并进行随机对照试验以建立基准,同时遵守TRIPOD+AI和FUTURE-AI共识指南,以确保在新兴的AI驱动的未来中实现伦理和有效的临床转化。

生物通微信公众号
微信
新浪微博


生物通 版权所有