单细胞多模态组学整合方法的系统性多任务基准测试研究

时间:2025年10月14日
来源:Nature Methods

编辑推荐:

为解决单细胞多模态组学技术快速发展带来的数据整合方法选择难题,研究人员开展了系统性分类与全面基准测试研究,评估了40种整合方法在7大任务中的表现,建立了方法选择指南,为精准解析细胞异质性提供了重要实践依据。

广告
   X   

随着单细胞多模态组学技术的迅猛发展,研究人员现在能够在单个细胞中同时分析多种分子层面的信息,如基因表达(RNA)、表面蛋白丰度(ADT)和染色质可及性(ATAC)。这种技术进步使得我们能够在以前无法达到的分辨率和规模上解析复杂生物系统。然而,这些生物技术的快速发展也推动了数据整合方法的快速创新,导致迫切需要对这些方法进行系统分类、评估和基准测试。
选择最相关的整合方法是一个相当大的挑战,这取决于与研究目标相关的任务以及数据中存在的模态和批次的组合。了解每种方法在多任务中的表现情况,包括降维、批次校正、细胞类型分类和聚类、插补、特征选择和空间配准等任务,将有助于指导这一决策。
在这项发表于《Nature Methods》的注册报告中,研究人员通过系统分类和全面基准测试当前方法,制定了选择最合适的单细胞多模态组学数据分析方法的急需指南。该研究的第一阶段协议已于2024年7月30日原则上被期刊接受。
研究人员根据输入数据结构和模态组合,定义了四种原型单细胞多模态组学数据整合类别:"垂直"整合、"对角"整合、"镶嵌"整合和"交叉"整合。根据应用需求,他们进一步引入了七种常见任务,包括:(1)降维、(2)批次校正、(3)聚类、(4)分类、(5)特征选择、(6)插补和(7)空间配准。
研究团队使用专门为每个任务定制的评估指标面板,在64个真实数据集和22个模拟数据集上评估了40种整合方法。特别包括18种垂直整合方法、14种对角整合方法、12种镶嵌整合方法和15种交叉整合方法。
关键技术方法包括使用SymSim生成模拟数据集,采用AdaSampling和Annotatability进行数据清洗和重新注释,使用Signac包进行ATAC数据预处理,以及开发统一的评估流程涵盖七大类任务的质量评估和可扩展性分析。数据集来源包括公开的CITE-seq、SHARE-seq、SNARE-seq、TEA-seq等多组学数据集和空间转录组数据集。
垂直整合的降维和聚类性能
研究人员系统性地评估了垂直整合方法在降维和聚类任务上的性能。在13个RNA+ADT配对数据集上评估了14种方法,在12个RNA+ATAC配对数据集上评估了14种方法,在4个包含所有三种模态的数据集上评估了5种方法。
结果显示,在代表性数据集D7上,Seurat WNN、sciPENN和Multigrate表现出更好的性能,有效保留了细胞类型的生物学变异。评估指标在方法评估上基本一致,但也观察到排名上的显著差异。总结所有数据集的性能表明,数据集复杂性可能影响整合方法的性能。模拟数据集可能缺乏真实数据中观察到的潜在数据结构,更容易整合。
垂直整合的特征选择
在特征选择任务中,只有Matilda、scMoMaT和MOFA+支持从单细胞多模态组学数据中选择分子标记。Matilda和scMoMaT能够为数据集中的每个细胞类型识别不同的标记,而MOFA+选择所有细胞类型的单一细胞类型不变标记集。
分析结果显示,MOFA+虽然无法选择细胞类型特异性标记,但在不同数据模态间产生了更可重复的特征选择结果。scMoMaT和Matilda选择的特征通常比MOFA+能更好地进行细胞类型聚类和分类。从ATAC模态选择的标记在聚类和分类评估中通常表现不佳。
对角整合方法基准测试
研究人员在降维、聚类、批次校正和分类任务上系统性地评估了14种对角整合方法。在包含单个RNA批次和单个ATAC批次的12个数据集上进行了评估,并在包含多个RNA批次和多个ATAC批次的6个数据集上评估了5种方法。
结果表明,scBridge和scJoint等方法在跨数据集的降维和聚类任务中 consistently表现出顶级性能。然而,它们在批次校正方面的有效性中等,表明在完全协调批次方面存在限制。相比之下,GLUE和uniPort等擅长批次校正的方法在降维和聚类方面没有表现出同样强大的性能。
镶嵌整合方法基准测试
研究人员接下来评估了7种镶嵌整合方法在17个数据集上的降维、聚类、批次校正和分类任务性能。结果显示,StabMap在大多数数据集的降维、聚类和分类任务中表现特别好。scMoMaT和Multigrate在跨数据集和数据类型上表现出强大的批次校正性能。
分析显示,可用的镶嵌整合方法相对较少,许多方法施加了严格限制,限制了它们的灵活性。这种缺乏灵活性可能使这些方法不太适用于具有多样化模态或有限共享特征的数据集,突出了在镶嵌整合中需要更灵活方法的需求。
镶嵌数据插补方法基准测试
虽然先前评估的镶嵌整合方法可以直接应用于镶嵌数据,但几种额外方法也可以通过首先插补缺失数据模态随后进行整合分析来应用于镶嵌数据。这些包括sciPENN、moETM、scMM、totalVI和UnitedNet。
研究发现,通过scMM插补的数据显示出与地面实况良好的结构相似性,但这并没有转化为更好的聚类和分类结果。相反,通过sciPENN插补的数据在通过聚类和分类指标评估时表现出良好的性能,但与通过其他方法插补的数据相比,与地面实况的结构相似性最低。
交叉整合方法基准测试
研究人员接下来在交叉整合上评估了方法的降维、聚类、批次校正和分类任务性能,其中数据集中的所有批次都存在所有数据模态。这包括7个多批次双模态RNA+ADT数据集、4个多批次双模态RNA+ATAC数据集、3个多批次双模态ADT+ATAC数据集和3个多批次三模态RNA+ADT+ATAC数据集。
这些分析再次证实了上述观察到的批次校正指标与其他评估指标之间的不一致,突出了在任务间实现平衡性能的挑战。例如,scMDC在降维、聚类和分类方面表现良好,但在批次效应去除方面竞争力较差。
空间配准方法基准测试
空间配准将来自不同切片的空间转录组数据对齐到共同的空间框架中。研究人员在12个数据集上评估了5种方法的空间配准性能。结果显示,具有中心对齐的PASTE在所有数据集上 consistently表现良好。PASTE2也表现出强大而稳定的性能,在大多数情况下具有竞争力。
计算时间和峰值内存使用
随着数据集中细胞数量的增加,计算速度成为整合中的关键因素。评估发现,在垂直整合中,UINMF在计算时间和峰值内存使用方面是最有效的方法之一。在对角整合中,大多数方法执行非常快速且内存消耗最小。在镶嵌整合中,MultiVI显示计算时间使用显著增加,scMoMaT显示内存使用大幅增加。
方法稳健性和一致性
为了评估方法的稳健性和一致性,研究人员首先通过随机排除大约20%的细胞类型进行稳定性分析。大多数方法表现出稳健的性能,具有相对较小的误差条。还评估了需要随机种子的方法,发现不同随机种子引入的变异性通常低于数据扰动引入的变异性。
研究结论表明,深度学习方法在评估的40种整合方法中占26种, consistently在所有数据类型的对角和交叉整合任务中获得最高排名。这些方法通常涉及多层神经网络,计算密集,需要图形处理单元加速来实现计算效率。
总的来说,这项基准研究提供了单细胞多模态组学数据整合计算方法的全面概述,为研究人员和方法开发人员提供了有价值的指导,以应用和开发针对数据整合特定方面的新方法。研究人员还开发了一个Shiny应用程序,使用户能够动态和交互式地可视化基准结果。
该研究强调了评估指标局限性、生物信号保存与批次校正之间的权衡,以及模拟数据集与真实数据集之间的性能差异等重要问题。这些发现将为单细胞多模态组学领域的数据整合方法选择和开发提供重要指导。

生物通微信公众号
微信
新浪微博


生物通 版权所有