从单细胞测序数据中推断CNV,五种热门工具大比拼

时间:2025年7月14日
来源:AAAS

编辑推荐:

近日,美国洛马林达大学、国立卫生研究院等机构的研究人员系统评估了五种广泛使用的工具,它们可从单细胞RNA测序数据中推断CNV。分析结果显示,不同方法在性能上存在显著差异,具体取决于数据类型和实验设计。

广告
   X   

众所周知,遗传异质性在多种癌症类型中广泛存在,包括肿瘤间和肿瘤内的异质性。拷贝数变异(CNV)在癌症的发生和发展中起着关键作用,但以单细胞分辨率检测它们仍具有挑战性。

近日,美国洛马林达大学、国立卫生研究院等机构的研究人员系统评估了五种广泛使用的工具,它们可从单细胞RNA测序数据中推断CNV。分析结果显示,不同方法在性能上存在显著差异,具体取决于数据类型和实验设计。

值得注意的是,CaSpER和CopyKAT在CNV推断方面表现最佳,而inferCNV和CopyKAT在鉴定肿瘤亚群方面表现出色。这项研究成果发表在《Precision Clinical Medicine》杂志上,为研究人员解码癌症异质性提供了指南。

癌症并非单一疾病,而是一个由遗传特征各异的细胞组成的动态生态系统,每个细胞都在选择压力下进化。推动这种多样性的关键机制之一是拷贝数变异,也就是DNA大片段的重复或缺失,进而改变基因的剂量和功能。

虽然批量细胞测序可以检测到CNV,但它掩盖了重要的单细胞差异。随着单细胞RNA测序(scRNA-seq)技术的兴起,人们现在有机会通过转录组信号来推断CNV。然而,这并不是一项简单的任务。

不同的推断方法在灵敏度、特异性和稳定性方面差异很大,而且缺乏系统性评估,让研究人员难以判断哪种工具更可靠。考虑到这些局限性,目前需要严格的基准测试研究来指导人们进行准确的CNV检测。

在这项研究中,研究团队在不同的scRNA-seq平台和肿瘤模型上测试了五种流行的CNV推断方法——HoneyBADGER、inferCNV、sciCNV、CaSpER和CopyKAT。他们的目标是:确定哪些工具能够在真实的研究环境中提供最准确、最可靠的CNV信息。

研究人员将这些方法应用于多个数据集,这些数据集来自不同的scRNA-seq平台、配对肿瘤-正常细胞系、肺癌细胞混合物以及临床样本。他们采用灵敏度、特异性和准确性等指标对其进行性能评估。

结果显示,CaSpER和CopyKAT在CNV推断方面表现最为均衡,但其实际效果会因测序深度和平台类型而异。相比之下,在分析单一平台的数据时,inferCNV、sciCNV和CopyKAT在鉴定细胞亚群方面表现出色。

研究团队还测试了每种方法检测罕见肿瘤亚群的能力。InferCNV表现出较高的灵敏度,尤其是在测序细胞数量充足的情况下,而sciCNV和HoneyBADGER在这方面表现不佳。

在整合多个平台的数据集时,批次效应会严重影响大多数方法的性能,除非使用ComBat等工具进行校正。基于等位基因的HoneyBADGER版本尽管总体上灵敏度较低,但它对这种与批次相关的失真具有更强的抗干扰能力。

最后,研究人员利用小细胞肺癌临床样本的数据进行验证。结果显示,CaSpER和CopyKAT产生了最准确的CNV检出结果,而inferCNV和CopyKAT在鉴定复发亚克隆上表现突出。

共同通讯作者、洛马林达大学的Charles Wang教授表示:“在单细胞水平上了解癌症对于应对肿瘤进化和治疗耐药性至关重要。我们的基准测试工作为该领域提供了清晰的参考点——不仅突出了哪些工具性能最佳,还明确了在何种条件下有效。”

这项研究为选择CNV推断工具提供了实用指南,可帮助人们选择适用于特定测序平台和研究目标的工具。随着单细胞基因组学从实验室走向临床,准确分析CNV等遗传变异的能力对于疾病诊断、生物标志物发现和追踪治疗应答至关重要。


生物通微信公众号
微信
新浪微博


生物通 版权所有