scMORE:整合单细胞多组学与多基因信号揭示免疫与衰老相关疾病的细胞类型特异性调控子

时间:2025年12月18日
来源:Nature Aging

编辑推荐:

本研究开发了scMORE方法,通过整合单细胞多组学数据与GWAS汇总统计数据,首次实现了在细胞类型特异性水平系统识别与复杂疾病相关的增强子-调控子(eRegulons)。该方法在31种免疫和衰老相关性状中验证了其优越性,特别是在帕金森病中鉴定出77个衰老相关eRegulons,并揭示了神经元中性别依赖性调控异常。研究为解读GWAS信号提供了新框架。

广告
   X   

随着全基因组关联研究(GWAS)的快速发展,科学家们已经识别出数千个与复杂疾病相关的遗传变异。然而,大多数变异位于非编码调控区域,由于基因调控具有细胞类型特异性,使得功能解读变得复杂。单细胞测序技术的进步为在细胞水平解析疾病相关的核心基因调控网络提供了前所未有的多模态视角,但如何将GWAS信号与单细胞数据有效整合,以揭示特定细胞背景下与复杂疾病相关的主调控因子,仍是当前领域的重大挑战。
为了突破这一瓶颈,研究人员开发了scMORE(单细胞多组学调控子富集)方法,这是一种基于网络的多基因富集方法,能整合单细胞多组学和GWAS数据,识别与复杂疾病相关的细胞类型特异性增强子-调控子(eRegulon)。该方法通过构建转录因子(TF)-peak-靶基因的全局调控网络,采用改良的余弦相似性方法推断细胞类型特异性eRegulons,并将多基因信号映射到peak-基因对,结合细胞类型特异性生成性状相关调控子评分。
研究团队利用来自外周血单核细胞(PBMC)的真实单细胞多组学数据集,对scMORE进行了全面评估。分析结果显示,scMORE能有效识别与淋巴细胞计数性状相关的CD8+T细胞特异性eRegulons(如ZEB1、IKZF1、FOXO1和ZNF721),而在单核细胞中未发现显著eRegulons。这些发现与已知生物学知识一致,如FOXO1对记忆T细胞形成至关重要,IKZF1在淋巴细胞发育和造血过程中起关键作用。
在自身免疫疾病研究中,scMORE整合PBMC单细胞多组学数据集与五种自身免疫疾病(系统性红斑狼疮SLE、炎症性肠病IBD、类风湿关节炎RA、溃疡性结肠炎UC和原发性胆汁性胆管炎PBC)的GWAS数据,鉴定了26个与至少一种疾病显著相关的eRegulons。值得注意的是,FOXO1 eRegulon在CD8+和CD4+T细胞中对所有五种自身免疫疾病均显著,而SPI1 eRegulon在SLE、UC、RA和IBD中与两种髓系细胞类型(单核细胞和mDCs)显著相关。
帕金森病(PD)作为第二常见的神经退行性疾病,其遗传风险位点如何调控疾病进程(尤其是在衰老中脑)尚不清楚。研究团队应用scMORE整合来自人中脑的单核配对多模态测量数据与PD GWAS汇总统计数据,涵盖了少突胶质细胞(ODCs)、少突胶质前体细胞(OPCs)、小胶质细胞(MG)、星形胶质细胞(ASs)、内皮细胞(ECs)、神经元(Ns)和外周T细胞(Ts)等七种细胞类型。分析鉴定出273个与PD显著相关的细胞类型-eRegulon对,其中星形胶质细胞(21.98%)和少突胶质前体细胞(14.29%)具有最高比例的显著PD相关eRegulons。研究还发现77个与衰老相关的eRegulons也与PD显著相关,包括ZFPM2、ZEB1、MEF2C、SOX6、NFATC2和CCDC88A等。
在精神疾病方面,研究团队引入scHOB(单细胞人类类器官库),这是一个包含10种广泛使用的人类类器官的scRNA-seq和scATAC-seq数据的精选数据库。通过整合人类大脑类器官单细胞多组学数据与八种神经精神疾病(精神分裂症SCZ、注意缺陷多动障碍ADHD、自闭症谱系障碍ASD、重度抑郁症MDD、双相情感障碍BIP、神经性厌食症AN、强迫症OCD和抽动秽语综合征TS)的GWAS汇总统计数据,scMORE鉴定出58个与一种或多种神经精神疾病显著相关的eRegulons。这些eRegulons中,77.59%与至少三种精神疾病相关,其中兴奋性神经元(ExN)特异性eRegulons表现出最多的关联。
关键技术方法方面,研究主要采用了单细胞多组学数据整合分析(包括scRNA-seq和scATAC-seq)、广义线性模型(GLM)构建转录因子-基因调控网络(TF-GRN)、改良余弦相似性计算细胞类型特异性(CTS)、多基因富集分析、蒙特卡洛(MC)置换检验评估显著性、以及类器官数据库(scHOB)构建与分析。
评估scMORE在识别免疫特异性eRegulons方面的性能
研究人员通过系统基准测试评估了scMORE中GLM的性能,并与两种替代方法(正则化线性模型GLMNET和梯度提升随机森林回归模型XGBoost)进行比较。结果显示,基于余弦相似性的scMORE与GLM模型在识别血液性状相关eRegulons方面 consistently优于其他两种方法。虽然GLM-based方法在五种不同组织来源的不同细胞数量的数据集中推断出的eRegulons较少,但其与十种血液性状的关联比其他模型更为保守。
scMORE识别自身免疫疾病的免疫细胞类型特异性eRegulons
为了研究自身免疫中的共享调控架构,研究人员整合了PBMC单细胞多组学数据集与五种自身免疫疾病的GWAS数据。通过连锁不平衡评分回归(LDSC)估计遗传相关性并量化位点重叠,揭示了这些疾病间强大的共享遗传架构。应用scMORE鉴定出26个eRegulons(包含20个或更多基因)在七种免疫细胞类型中与至少一种疾病显著相关。
scMORE识别与疾病相关的衰老相关eRegulons
帕金森病(PD)是第二常见的神经退行性疾病,虽然许多PD遗传风险位点已被报道,但遗传变异如何调控PD(尤其是在衰老中脑)仍不清楚。研究人员应用scMORE整合来自人中脑的单核配对多模态测量数据与PD GWAS汇总统计数据,分析了七种脑细胞类型。在286个eRegulons中,74.13%(包含20个或更多基因)被保留用于下游分析。
scMORE识别精神疾病的关键eRegulons
人类类器官是先进的3D模型,能重现人类发育和功能的关键特征。与研究团队引入scHOB(单细胞人类类器官库),这是一个精选数据库,整合了十种广泛使用的人类类器官的scRNA-seq和scATAC-seq数据集。为了展示scMORE在类器官数据上的应用,研究人员整合了人类大脑类器官单细胞多组学数据与八种神经精神疾病的GWAS汇总统计数据。
本研究开发的scMORE方法展示了在单细胞多组学数据中捕捉关键疾病相关eRegulons的能力。通过其基于网络的多基因富集框架,scMORE能够发现与复杂性状和疾病有生物学合理联系的关键eRegulons。同时提出的scHOB为一个综合性单细胞多组学资源,为类器官研究社区提供了多种功能。在特定细胞背景下识别可重复的、性状相关的eRegulons是阐明复杂疾病调控机制和推进精准医学的关键一步。
该研究的主要意义在于开发了一个能有效整合单细胞多组学与GWAS数据的新方法,解决了当前在将多基因GWAS信号与细胞类型特异性eRegulons联系方面的空白。通过在31种免疫和衰老相关性状中的验证,scMORE不仅重现了已确立的细胞类型特异性eRegulon-疾病关联,还发现了许多尚未在现有文献中记载但生物学上合理的富集。此外,研究还提供了scHOB这一资源,支持类器官研究,为理解发育和疾病机制提供了重要平台。
研究的创新点包括:提出了一个新的计算框架scMORE,能系统识别细胞类型特异性调控子;开发了scHOB数据库,整合了大量类器官单细胞数据;在帕金森病和自身免疫疾病中发现了新的调控机制;揭示了衰老相关eRegulons在神经退行性疾病中的重要作用;为精神疾病的机制研究提供了新见解。
总之,这项研究通过开发新的计算方法和资源,为理解复杂疾病的细胞类型特异性调控机制提供了重要工具和见解,对未来精准医学和疾病治疗策略的发展具有重要推动作用。

生物通微信公众号
微信
新浪微博


生物通 版权所有