编辑推荐:
本研究针对传统多基因风险评分(PRS)在疾病生物学机制解析方面的局限性,开发了基于图神经网络的单细胞PRS框架scPRS。研究人员整合单细胞染色质可及性数据(scATAC-seq),在2型糖尿病、肥厚型心肌病、阿尔茨海默病和重症COVID-19等多种疾病中实现了更精准的遗传风险预测,同时可优先识别疾病关键细胞类型,并通过多层组学分析揭示细胞类型特异的变异-调控元件-基因关联网络。该研究为单细胞遗传学研究奠定了方法学基础,为复杂疾病的精准预测和机制解析提供了统一框架。
在精准医学时代,多基因风险评分(PRS)已成为预测个体疾病遗传风险的重要工具。然而传统PRS方法存在两大瓶颈:一方面,其预测性能受限于对复杂疾病遗传架构的简化建模;另一方面,作为单纯的统计模型,PRS难以揭示疾病背后的生物学机制。这些问题在具有显著细胞异质性的复杂疾病中尤为突出——风险变异可能通过不同细胞类型特异的调控机制影响疾病易感性,但传统方法无法解析这种细胞层面的复杂性。
针对这一挑战,美国佛罗里达大学、斯坦福大学医学院等机构的研究团队在《Nature Biotechnology》发表了突破性研究成果。研究人员开发了名为scPRS的单细胞多基因风险评分系统,通过整合单细胞染色质可及性数据(scATAC-seq)和图神经网络(GNN)建模,首次实现了单细胞分辨率的遗传风险预测和机制解析。该研究不仅显著提升了多种复杂疾病的预测准确性,还系统揭示了疾病相关的关键细胞类型及其特异的基因调控网络。
研究团队采用了多项关键技术:基于单细胞/单核染色质可及性测序(scATAC-seq/snATAC-seq)构建参考数据集;开发图神经网络框架整合单细胞水平PRS特征;利用英国生物银行(UK Biobank)和百万退伍军人计划(MVP)等大型队列进行验证;结合序列深度学习模型预测变异功能效应;通过诱导多能干细胞(iPSC)分化模型进行实验验证。这些技术的协同应用使研究兼具计算创新与实验深度。
研究结果部分,首先在"scPRS准确预测疾病"中,研究团队在四种疾病中系统评估了scPRS的预测性能。与六种主流PRS方法相比,scPRS在肥厚型心肌病(HCM)(AUROC=0.692±0.079)、阿尔茨海默病(AD)(0.743±0.017)和重症COVID-19(0.591±0.029)中均表现出最优预测性能。特别值得注意的是,scPRS仅使用了约11%的变异(位于开放染色质区域的变异)就超越了使用全基因组变异的方法,凸显了非编码变异的重要贡献。
在"scPRS优先识别疾病相关细胞"部分,研究揭示了各疾病的关键细胞类型:2型糖尿病(T2D)中的GCGhighα细胞和INShighβ细胞;HCM中的心肌细胞(CDMs)和周细胞;AD中的小胶质细胞、星形胶质细胞和少突胶质前体细胞(OPCs);COVID-19中的巨噬细胞、自然杀伤(NK)细胞和单核细胞。这些发现不仅验证了已知的疾病相关细胞类型,还发现了如HCM中周细胞等新关联。
"scPRS揭示疾病调控程序"部分展示了多层组学分析的强大解析能力。以AD为例,研究不仅确认了已知风险变异rs10792832通过小胶质细胞特异性调控元件影响PICALM表达的机制,还发现了新变异rs7922621通过破坏TFAP2A结合位点,降低ANXA11和TSPAN14表达的调控路径。通过iPSC分化的小胶质细胞模型,研究团队证实抑制这两个基因确实会损害小胶质细胞的吞噬功能,为AD发病机制提供了新见解。
在HCM研究中,scPRS分析发现心肌细胞特异性风险变异rs886125可能通过影响ZNF382结合来调控已知HCM基因MYL2的表达。iPSC分化心肌细胞的RNA-seq分析显示,HCM风险基因在患者来源细胞中表达降低,而FDA批准药物Mavacamten可逆转这种异常,为药物作用机制提供了分子层面解释。
研究结论部分强调,scPRS建立了遗传风险预测与生物学机制发现之间的桥梁,开创了"单细胞遗传学"研究新范式。该方法不仅提高了PRS的预测性能,更重要的是实现了从统计关联到生物学机制的转化。通过识别疾病相关细胞类型及其特异的调控程序,scPRS为开发靶向特定细胞通路的精准治疗策略提供了新思路。此外,研究证实约40%的HCM病例可能由非编码调控变异驱动,这拓展了对心脏病遗传架构的认知。随着单细胞多组学数据的积累,scPRS框架有望应用于更多复杂疾病研究,推动精准医学向细胞类型特异性干预方向发展。
生物通 版权所有