Nature子刊:新工具解决单细胞数据的可靠性危机

时间:2025年7月8日
来源:AAAS

编辑推荐:

为了解决这一问题,韩国科学技术院(KAIST)和基础科学研究所(IBS)的研究人员开发出一种新工具:scICE(单细胞聚类不一致估计工具)。

广告
   X   

单细胞RNA测序(scRNA-seq)技术彻底改变了生命科学研究,推动了免疫学、肿瘤学和发育生物学等领域的新发现。目前已有四万多项研究利用这一技术解析了生物体内错综复杂的细胞多样性。

然而,在这种爆炸式增长的背后,也隐藏着一个持续存在的问题:聚类不稳定性。当研究人员尝试根据表达模式对细胞进行分组,以鉴定细胞类型或疾病状态时,他们常常会遇到不一致的结果——即使反复分析同一数据集也是如此。

不准确的聚类分析可能让人们将正常细胞错误分类为癌细胞,或遗漏稀有但关键的细胞类型,进而影响结果解读和治疗决策。这种“可靠性危机”迫使科学家们重新开展分析,或依赖计算成本高昂的流程来获得可靠的见解。

为了解决这一问题,韩国科学技术院(KAIST)和基础科学研究所(IBS)的研究人员开发出一种新工具:scICE(单细胞聚类不一致估计工具)。

这项研究成果于7月2日发表在《Nature Communications》杂志上,可提供一致的聚类结果。

一般来说,对聚类可靠性的评估是通过反复分析单个细胞对是否被归入同一细胞簇来得出共识的。然而,这种方法计算量巨大,不适用于包含数万个细胞的大规模数据集。

相比之下,scICE可以应用于大规模数据集,因为它绕过了计算量巨大的成对共聚类过程。它采用数学上定义的不一致系数(IC)来直接评估细胞分配的稳定性。这使得该工具能够有效地检测并过滤掉不可靠的分配,仅保留最稳定且具有生物学意义的细胞簇。

论文第一作者、韩国基础科学研究所的Hyun Kim博士解释说:“单细胞聚类分析的可靠性长期被忽视。scICE为快速轻松地验证结果开辟了一条新途径。”

研究团队将scICE应用于48个真实和模拟的scRNA-seq数据集,以验证新工具的有效性,这些数据集来自大脑、肺部和血液等组织。

结果显示,目前约三分之二的分析结果在统计上不稳定且不可靠。与此同时,scICE能够高效地筛选出少数可靠的结果,节省了研究人员的时间和计算资源,同时保持了较高的准确性。

scICE采用数学方法验证聚类结果,确保基于单细胞数据得出的结论可信度更高。

此外,scICE还能有效检测稀有的细胞类型,而这些细胞类型往往被传统的聚类方法所忽略。在实际应用中,scICE通过其框架下的子聚类分析,可靠鉴定出传统分析中容易遗漏的稀有免疫细胞。

通讯作者、韩国科学技术院的Jae Kyoung Kim教授表示:“scICE将助力研究人员获得可靠的结果并迅速开展后续研究。我们希望它成为生命科学研究中可靠的数据解读工具。”

目前,研究团队将scICE公开发布在GitHub上,以便所有用户轻松访问。地址为:https://github.com/Mathbiomed/scICE。


生物通微信公众号
微信
新浪微博


生物通 版权所有