在生命科学的微观世界里,细胞的“身份”和功能状态很大程度上由其内部活跃的RNA分子决定。这些RNA分子不仅是合成蛋白质的模板(信使RNA,mRNA),更包括种类繁多、功能各异的非编码RNA,例如调控基因表达的微小RNA(miRNA)、参与剪接过程的核小RNA(snRNA)和核仁小RNA(snoRNA),以及负责搬运氨基酸的转移RNA(tRNA)等。然而,当前主流的单细胞RNA测序(scRNA-seq)技术主要依赖捕获带有polyA“尾巴”的mRNA,这使得占转录组很大一部分、且不具polyA尾巴的非编码RNA成为了“盲区”。尽管已有一些专门检测非编码RNA的方法,但它们往往需要特殊设备、复杂操作或定制流程,难以实现大规模、高通量的应用,限制了我们在单细胞水平全面解析细胞调控网络的能力。
为了突破这一瓶颈,由Alina Isakova等人领导的研究团队开发了一种名为TotalX的全新、可扩展的单细胞总RNA测序框架。该研究成功地将TotalX应用于人类外周血单个核细胞、登革热病毒2型(DENV2)感染的肝细胞以及发育中的人脑等多个复杂生物系统,首次在单细胞分辨率下实现了编码与非编码RNA的同步、高通量检测。研究揭示了不同细胞类型中非编码RNA的特异性表达程序,绘制了它们与编码基因的共表达调控网络,并发现了与神经发育疾病相关的关键miRNA的时空动态。这项重大技术进展及其产生的丰富数据,为在细胞图谱规模深入理解细胞身份、发育轨迹和疾病机制打开了新的大门。相关研究成果已正式发表在顶级期刊《自然·生物技术》(Nature Biotechnology)上。
关键技术方法概述
本研究核心技术为TotalX,它是一种适配于商业化微流控(10x Genomics Chromium平台)的单细胞总RNA测序方法。其核心步骤包括:(1)酶促polyA加尾与逆转录:对总RNA(包括非腺苷化RNA)进行体外酶促polyA加尾,并使用定制的模板转换寡核苷酸(dUTSO)进行逆转录。(2)rRNA去除:在cDNA预扩增后,使用CRISPR-Cas9介导的DASH技术特异性去除核糖体RNA序列。(3)片段分离与建库:将cDNA按长短(>400 bp和<400 bp)分离建库,并可选择性富集小片段(~18-50 bp)以提升miRNA检测。(4)数据分析:通过改进的Cell Ranger流程进行双参考基因组比对,实现对长短RNA的统一定量。研究样本涵盖HEK293T细胞、健康成人外周血单个核细胞、DENV2感染的Huh7肝细胞,以及来自4个个体的发育中(孕19周至16岁)人脑多个区域的组织样本。
研究结果
TotalX实现单细胞中非编码RNA的高通量检测
研究人员开发了TotalX方法,其核心是通过酶促polyA化、定制dUTSO逆转录和Cas9介导的rRNA去除,在标准液滴平台上捕获总RNA。与VASA-seq和标准10x 3‘平台相比,TotalX在达到相似测序深度时,能检测到可比数量的基因,并成功捕获了包括lncRNA、miRNA、snoRNA、snRNA、tRNA和组蛋白RNA在内的多种非编码RNA。通过可选的大小分选富集步骤(TotalX miRNA(+)),显著提升了内源性miRNA(如MIR17、MIR221、MIR222)的检测灵敏度,其表达水平与中低丰度的蛋白编码基因相当。
在人类PBMCs中解析细胞类型特异性的非编码RNA
将TotalX应用于人外周血单个核细胞,成功鉴定出T/B淋巴细胞、单核细胞、自然杀伤细胞等主要免疫细胞类型。研究发现数百种非编码RNA在不同细胞类型中差异表达,例如MIR650在浆母细胞中富集,MIR150在T细胞中高表达。研究还揭示了tRNA丰度与基于密码子使用分析的氨基酸需求之间存在强相关性。通过加权基因共表达网络分析,发现了同时包含编码和非编码基因的共调控模块,例如一个T细胞富集模块包含MIR150、SNORA26和CD28,另一个血小板特异性模块包含lncRNAs(SMANTIS, SMILR)与GP9、ITGA2B共表达。此外,分析证实了TotalX能够捕获已知的miRNA-靶基因负相关关系,如MIR150/EP300。
在DENV2感染细胞中同时检测非腺苷化病毒转录本和宿主转录组
以缺乏polyA尾巴的登革热病毒2型感染Huh7细胞为模型,TotalX成功在单细胞中同时捕获了病毒编码区(POLY)和结构化的非编码亚基因组RNA(sfRNA1-4)。根据宿主基因表达,感染细胞分为“主动应答”和“静息应答”两种状态。尽管病毒载量相似,静息应答细胞未能启动典型的抗病毒反应。在高病毒载量的静息细胞中,研究人员观察到组蛋白去乙酰化酶和乙酰化酶通路相关基因的富集,提示表观遗传重塑可能在抑制宿主应答中起作用。
在发育中的人脑中揭示非编码RNA的区域和细胞类型特异性表达
通过对孕19周、9月龄、8岁和16岁个体的人脑多个区域进行TotalX miRNA(+)分析,获得了超过30万个单细胞的转录组数据。研究绘制了非编码RNA在兴奋性/抑制性神经元、胶质细胞、免疫细胞等主要脑细胞类型中的动态表达图谱。研究发现,组蛋白mRNA在快速增殖的放射状胶质细胞中高表达,而snRNA和lncRNA在免疫细胞和分化神经元中富集。多个非编码RNA表现出显著的细胞类型特异性,例如MIR17在Cajal–Retzius细胞和深部兴奋性神经元中富集,LINC00299在星形胶质细胞和室管膜细胞中表达。
追踪发育神经元谱系中疾病相关miRNA的动态与靶基因抑制
聚焦于发育中的兴奋性和抑制性神经元谱系,研究发现Cajal–Retzius细胞是miRNA表达的“热点”,其中MIR137的表达尤为突出。MIR137是精神分裂症和智力障碍的全基因组关联研究显著相关基因座。在表达MIR137的细胞中,其许多已验证的靶基因(如SLC38A2、CDC42)显示出显著的负相关,这些靶基因富集于神经系统发育、WNT信号和轴突导向等通路。类似地,MIR17、MIR125B-2和MIR128-2等miRNA与其预测或验证的靶基因也呈现负相关关系,表明TotalX能够揭示发育过程中miRNA介导的转录后调控网络。
研究结论与意义
本研究提出的TotalX框架,成功解决了传统单细胞测序技术难以大规模捕获非腺苷化RNA的长期挑战。它通过在广泛使用的液滴平台上引入最小化的生化与计算修饰,实现了对编码和非编码RNA的同时、高通量检测,且与现有流程高度兼容。应用TotalX产生的多体系数据深刻揭示了非编码RNA在细胞身份决定、免疫应答、病毒感染和脑发育中的关键作用。特别是在发育中人脑的研究中,发现与精神分裂症强相关的MIR137特异性地高表达于指导大脑皮层分层构筑的关键先驱神经元——Cajal–Retzius细胞中,并与其靶基因呈现负相关,这为理解神经发育障碍的细胞起源和分子机制提供了全新线索。TotalX将单细胞转录组学的研究范畴从蛋白质编码基因扩展至完整的转录组,为构建更全面的细胞图谱、解析复杂的基因调控网络以及揭示疾病机制提供了强大的通用工具。尽管在检测环状RNA等方面仍有提升空间,但其建立的稳健、可及、可扩展的策略,无疑将推动单细胞生物学进入一个编码与非编码转录组统一研究的新时代。