综述:揭示细胞成分的变化:用于单细胞RNA测序的尖端差异丰度分析方法

时间:2026年4月28日
来源:TrAC Trends in Analytical Chemistry

编辑推荐:

肖英雪|孙静|郝友金|谢玲玲|窦宏瑞|邹月|李英红|秦丹|杨青霞|李波重庆师范大学生命科学学院,中国重庆401331摘要单细胞RNA测序(scRNA-seq)能够高分辨率地表征不同生物条件下的细胞异质性。其中一项核心的分析任务是差异丰度(DA)分析,该分析可以检测细胞组成和群体结

广告
   X   

肖英雪|孙静|郝友金|谢玲玲|窦宏瑞|邹月|李英红|秦丹|杨青霞|李波
重庆师范大学生命科学学院,中国重庆401331

摘要

单细胞RNA测序(scRNA-seq)能够高分辨率地表征不同生物条件下的细胞异质性。其中一项核心的分析任务是差异丰度(DA)分析,该分析可以检测细胞组成和群体结构的系统变化。尽管方法学进展迅速,但对于DA方法的整体综合理解——尤其是在其统计基础、建模假设和实际性能方面——仍然不足。本文对当前的DA方法进行了系统的概述,通过探讨它们的统计模型、计算要求和分析假设来澄清关键的概念差异。除了文献综述外,我们还对代表性方法进行了实际评估,以便从可用性、准确性和计算效率等方面进行比较。我们并不提倡单一的最佳解决方案,而是强调了方法特定的权衡,并提供了基于上下文的方法选择指南。总体而言,这项工作为在各种实验环境中选择、解释和应用DA方法提供了原则性的基础,支持稳健、可重复且生物学上有意义的单细胞分析。

引言

单细胞RNA测序(scRNA-seq)已成为一种变革性的工具,能够在单细胞水平上进行高通量转录组分析[1],克服了批量RNA测序在捕获异质组织中的关键转录信号方面的局限性[2],[3]。随着测序技术的不断发展,scRNA-seq已经在发育生物学[4]、肿瘤学[5]和神经科学[6]等领域带来了革命性的变化,使研究人员能够发现新的生物学见解,识别稀有和/或复杂的细胞群体,并预测细胞分化轨迹[7],[8],[9],在生物医学领域发挥着重要作用。通过提供高分辨率的细胞异质性定量和分析,scRNA-seq加深了我们对多种生物过程的理解[10]。
一个典型的scRNA-seq实验包括几个步骤(图1),包括组织解剖、细胞分选和分离、文库制备、RNA测序以及后续的数据分析[12],[13]。在最后阶段,采用一系列分析策略将测序结果转化为生物学上可解释的信息[14]。其中,差异丰度(DA)分析专注于识别实验条件下的细胞组成变化。这些组成变化通常反映了与疾病状态或复杂表型相关的功能改变,并可以提供关于潜在调控机制的见解,包括细胞相互作用和免疫调节。DA分析的结果为疾病相关的细胞改变提供了机制上的理解,从而支持下游的转化研究,包括药物开发[15]和更广泛的生物医学研究[16]。例如,在黑色素瘤中,DA分析可以揭示反应性免疫细胞亚群与非反应性免疫细胞亚群丰度的变化[17]。同样,Chua等人报告称,对重症和轻度COVID-19患者的DA分析显示,与健康对照组相比,重症患者的基底细胞减少而中性粒细胞增加,这为COVID-19疾病的严重性提供了新的视角[18]。
图2展示了与单细胞DA分析相关的出版物数量随时间的变化。大约在2011年,DA分析的研究最初在微生物组领域得到了关注[19]。由于微生物组和单细胞转录组数据之间存在共同的统计挑战,最初为微生物群落分析开发的DA方法随后被适应用于单细胞应用[20],[21],[22]。自2021年以来,对DA分析的兴趣激增,显著影响了遗传学、生物技术、应用微生物学和分子生物学等领域。随着这一领域的扩展,关于DA分析方法的基准研究开始出现。Simmons等人[23]进行了早期的贡献,他们研究了各种用于细胞类型水平DA分析的统计方法,包括Poisson回归和Dirichlet回归。他们的评估集中在运行时间、准确性和统计功效等性能指标上,并表明带有asin标准化的propeller回归和具有替代参数化的Dirichlet回归在大多数情况下表现良好。最近,Yi等人对DA方法进行了更广泛的基准测试,评估了Milo、DA-seq、MELD、Cydar、CNA和Louvain+GLM等方法,使用了接收者操作特征曲线下面积(AUROC)和精确度-召回曲线下面积(AUPRC)等指标。基于这些分析,Milo、Cydar、CNA和Louvain+GLM被推荐为在控制假发现率(FDR)的同时可靠地识别DA细胞群体的候选方法[16]。
尽管单细胞转录组学中的DA分析发展迅速,但这一领域的专门方法学综述仍然缺乏。现有的工作主要集中在基准测试式的评估上,这些评估提供了有用的性能比较,但对影响方法选择的底层算法原理、建模假设和实际考虑因素的洞察有限。为了填补这一空白,本文对单细胞DA分析方法进行了系统的综合,超越了以性能为中心的评估。本文的观点不仅基于对文献的系统性调查,还基于对代表性方法的实际评估和使用。我们关注不同的统计策略是如何设计来解决不同的分析挑战的,总结了代表性方法的关键特征和局限性,并探讨了它们在现实世界应用中的实际影响。通过将方法论原则与操作考虑结合起来,本文旨在支持明智的方法选择,并指导未来DA分析工具的开发。

章节片段

差异丰度分析方法

DA分析催生了一系列多样的方法论框架,反映了单细胞转录组数据和实验设计的日益复杂性。从操作角度来看,现有的DA方法大致可以分为基于计数的统计测试方法和基于模型的方法。基于计数的方法直接分析标注的细胞类型的比例,应用基本的统计测试(例如T检验、ANOVA)来评估丰度的差异

基于实际性能指标的方法选择

面对多样且迅速扩展的DA分析工具,选择合适的方法仍然具有挑战性,特别是对于涉及多个条件、批次效应和额外协变量的研究设计。实际上,方法的选择往往受到不同工具如何适应这些因素的限制,尤其是协变量调整和批次相关变异性。在补充说明表S1中提供了对这些实际考虑因素的概述

差异丰度分析的应用

DA分析方法已广泛应用于生物医学的各个领域。这些方法揭示了细胞异质性和功能变化,为免疫微环境、发育生物学、神经科学和衰老研究等领域的复杂生物现象和过程提供了深入的见解。

向连续细胞状态的概念转变

技术的进步显著提高了scRNA-seq分析的规模、准确性和灵敏度[120],[121],从而间接促进了DA分析效率和分辨率的提高(图8)。这些进步促使分析思维方式的转变,人们越来越认识到不同的细胞状态通常存在于连续谱上,而不是作为离散的、预先标注的簇[79]。因此,DA分析正在不断发展

结论和未来展望

单细胞差异丰度分析已成为表征不同生物和临床环境中细胞组成变化的核心分析策略。除了作为下游的统计测试外,DA分析越来越多地提供了关于细胞状态转换、协调响应和生态系统重塑的群体级视角。在这篇综述中,我们超越了方法的描述性目录,提出了一个结构化的框架来组织DA

CRediT作者贡献声明

郝友金:撰写——审稿与编辑、监督、调查。孙静:撰写——审稿与编辑、资源提供、正式分析。肖英雪:撰写——审稿与编辑、初稿撰写、可视化、调查、数据管理。李英红:撰写——审稿与编辑、监督。窦宏瑞:资源提供、调查。邹月:可视化、调查。谢玲玲:撰写——审稿与编辑、可视化。李波:撰写——审稿与编辑、监督、项目管理

作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。

致谢

本工作得到了重庆市科学技术研究计划教育委员会(KJQN202100538)、重庆市高等教育教学改革研究项目(233183)、国家自然科学基金(62101087)、中国博士后科学基金(2021MD703942)、重庆师范大学的研究生研究创新项目(YKC23027)以及云南植物生殖适应与进化生态学重点实验室开放基金的支持

生物通微信公众号
微信
新浪微博


生物通 版权所有