祖源基因组功能差异揭示少突胶质细胞在阿尔茨海默病中的新机制:跨人群(非洲、美洲原住民、欧洲)iPSC模型的多组学探索

时间:2025年9月14日
来源:Alzheimer's & Dementia

编辑推荐:

本刊推荐:本研究利用诱导多能干细胞(iPSC)技术首次构建涵盖非洲(AF)、美洲原住民(AI)和欧洲(EU)三大祖源的少突胶质细胞模型,通过单核RNA测序(snRNA-seq)、转座酶可及染色质测序(ATAC-seq)和高通量染色体构象捕获(Hi-C)技术,揭示APOE ε4/ε4基因型携带者普遍存在胆固醇生物合成基因上调和髓鞘形成标志物下降现象,并发现祖源特异性差异显著影响阿尔茨海默病(AD)全基因组关联研究(GWAS)基因的表达与染色质可及性,为跨人群精准医疗提供关键理论基础。

广告
   X   

1 背景

阿尔茨海默病(AD)作为一种毁灭性神经退行性疾病,其特征是进行性认知衰退和记忆丧失。年龄是其最强风险因素,但遗传学在驱动AD风险中扮演关键角色。迄今通过全基因组关联研究(GWAS)已识别超过100个AD易感基因位点,但这些研究主要基于非西班牙裔白种人数据,非洲(AF)、非裔美国人和西班牙裔/拉丁裔人群代表性严重不足。近期大型多中心合作项目如阿尔茨海默病测序计划(ADSP)正推动这些人群在遗传研究中的纳入。值得注意的是,西班牙裔/拉丁裔和非裔美国人属于混合人群,前者具有欧洲(EU)、美洲原住民(AI)和AF祖源的不同组合,后者主要具有AF和EU祖源。扩展基因组研究中的祖源代表性至关重要,因为风险位点和风险等位基因效应大小在人群间存在明显差异。例如,载脂蛋白E(APOE)基因的ε4等位基因是晚发性AD最显著的遗传易感因素,对东亚(尤其是日本)人群影响最大,其次是非西班牙裔白种人(EU),而对非洲血统人群影响相对较小。这些差异的机制被证明与APOE局部祖源基因组调控架构(GRA)的祖源特异性变异有关,且GRA不仅具有祖源偏向性,还具有细胞类型特异性。

尽管大量研究聚焦神经元在AD发病机制中的作用,但近期证据表明胶质细胞(包括少突胶质细胞)在AD病因学中扮演关键角色。少突胶质细胞(OL)传统以在中枢神经系统(CNS)中髓鞘化轴突的功能而闻名,但由于其参与多种AD相关病理过程(如神经炎症、氧化应激和突触功能障碍)而成为AD研究的新焦点。例如,许多AD风险基因(如APP、ANK3、BACE1、BIN1、PICALM、PSEN1和SORT1)在少突胶质细胞中高表达。此外,灰质中磷酸化tau蛋白与AD患者白质异常和脱髓鞘相关,且这些异常出现在临床AD症状发作之前,支持了少突胶质细胞在AD发病机制中的重要性。基于这些原因,本研究比较了具有显著AF、AI或EU全球祖源的诱导多能干细胞(iPSC)来源的少突胶质细胞的GRA。总之,我们的结果为AD研究界提供了资源,以获取可能特定于某些人群的遗传因素知识,从而更全面地理解这种疾病。

2 方法

2.1 样本收集

样本通过非洲美国人AD遗传研究(R01AG072547和U01-AG052410)、波多黎各阿尔茨海默病倡议(PRADI)和秘鲁AD进行中研究(R01-AG070864)获得。研究经迈阿密大学和秘鲁卡耶塔诺埃雷迪亚大学机构审查委员会(IRB)批准。所有参与者根据迈阿密大学指南和规定提供知情同意。对所有参与者进行认知评估(包括Stick Design测试、UDS3电池、IDEAS电池、临床痴呆评级(CDR)、Tanner电话筛查和医疗史审查),并由委员会认证的神经学家和神经心理学家评估以确定临床诊断。获取家族史,所有个体进行基因分型和全基因组测序(WGS)。分析WGS数据以识别相关个体,并排除此类个体。此外,筛选WGS中AD相关基因的已知风险变异,包括APOE、ABCA7缺失(Arg578Alafs*16)、APP、PSEN1和2、SORL1和TREM2。携带这些基因致病变异的个体被排除研究。

2.2 诱导多能干细胞

从全血中通过密度梯度离心使用SepMate-50管和Lymphoprep培养基提取外周血单核细胞(PBMC)。选择来自AD患者或年龄匹配非痴呆对照的PBMC基于其全球祖源(>90% EU、AF或AI)进行重编程,使用CTS™ CytoTune™-iPS 2.1仙台病毒重编程试剂盒在Hussman人类基因组学研究所iPSC核心设施中生成iPSC。每个个体选择一个iPSC克隆基于集落形态进行扩增用于下游分化。所有iPSC系在使用前完全表征。每系表现与未分化人类胚胎干细胞一致的形态,包括高核质比、突出核仁和边界清晰的紧凑集落。通过免疫细胞化学染色经典标志物nanog、oct4和sox2确认所有系的多能性。通过RT-PCR确认所有系中仙台病毒(SeV)衍生重编程载体的缺失。G带细胞遗传学分析确认正常核型无染色体异常,PCR检测验证所有系无支原体污染。

2.3 全球祖源估计

使用ADMIXTURE软件中的基于模型聚类算法计算混合比例。在K=4进行监督ADMIXTURE分析,纳入来自人类基因组多样性计划(HGDP)和1000 Genomes Phase 3合并参考面板的四个参考人群(AI、EU、AF和EA)。

2.4 少突胶质细胞包含球体的衍生

iPSC来源的少突胶质细胞遵循先前建立的协议进行分化,略有修改。简要来说,iPSC系在玻连蛋白包被板上培养,维持在Stemflex培养基中直至达到70%至90%汇合度。然后使用ACCUTASE将这些培养物解离成单细胞。解离后,以5×105至1×106细胞每孔的密度铺在Matrigel包被的六孔板中,在补充RevitaCell的StemFlex培养基中。细胞在37°C、5% CO2下孵育1至2天,直至形成直径约100至250 µm的集落。达到所需大小后,使用神经诱导培养基(NIM)补充SB431542(10 µM)、LDN193189(250 nM)或视黄酸(100 nM)诱导8天,每天完全更换培养基。第8天,细胞过渡到N2培养基(DMEM/F12带有L-谷氨酰胺、N2补充剂(1×)、非必需氨基酸(NEAA)、青霉素-链霉素(PenStrep)和2-巯基乙醇)补充视黄酸(100 nM)和平滑激动剂(1 µM)。细胞在N2培养基中维持4天,每天更换培养基并添加新鲜补充剂。第12天,通过免疫细胞化学染色olig2评估每个系产生少突胶质细胞的能力。汇合单层使用手术刀以格子状模式机械破坏以产生聚集体。新形成的聚集体使用细胞提升器从孔中 detached,并以1:2比例铺在超低附着板上,使用N2B27培养基(N2培养基带有缺乏维生素A的B27补充剂),补充视黄酸(100 nM)和平滑激动剂(1 µM)。细胞在N2B27培养基中培养8天,每隔一天更换2/3培养基。随后细胞切换到PDGF培养基(DMEM/F12带有L-谷氨酰胺、N2补充剂(1×)、NEAA、PenStrep、2-巯基乙醇、PDGFaa(10 ng/mL)、IGF-1(10 ng/mL)、HGF(5 ng/mL)、NT3(10 ng/mL)、T3(60 ng/mL)、生物素(100 ng/mL)、cAMP(1 µM)和胰岛素25 µg/mL),每隔一天更换2/3培养基持续10天。选择直径300至800 µM的金色或棕色圆形聚集体,以每六孔板孔20个聚集体的密度铺在PLO/层粘连蛋白包被板上,使用胶质细胞培养基(DMEM/F12带有L-谷氨酰胺、N2补充剂、NEAA、PenStrep、2-巯基乙醇、HEPES、T3、生物素、cAMP、胰岛素、抗坏血酸)。聚集体在PLO/层粘连蛋白板上维持45天,每隔一天更换2/3培养基。第55天,进行O4活体染色,并量化O4阳性细胞以确认所有系向少突胶质细胞的分化率相似。

2.5 核分离用于10×铬单细胞多组ATAC +基因表达(RNA-seq)

分化诱导后第76天收获培养物,核分离通过10×协议完成:“从复杂组织分离核用于单细胞多组ATAC +基因表达测序”,略有调整。简要来说,使用ACCUTASE在37°C下5分钟将培养物从板上 detached,然后用PBS + 0.04% BSA洗涤。细胞沉淀然后重悬于带有DNAse I(0.1 U/µL)的RDD缓冲液中,在冰上孵育5分钟。DNAse I处理后,细胞用PBS + 0.04% BSA洗涤两次。沉淀随后重悬于NP40裂解缓冲液,冰上孵育5分钟,并使用带有无绳电机的沉淀杵均质化。均质物然后通过40 µm strainer过滤并沉淀。添加核重悬缓冲液到沉淀,随后冰上孵育5分钟。沉淀然后重悬并用核重悬缓冲液洗涤两次。通过台盼蓝染色评估裂解效率,并使用Countess II FL自动细胞计数器计数核。验证裂解达到>95%后,核沉淀,重悬于0.1X裂解缓冲液,冰上孵育2分钟,用洗涤缓冲液洗涤一次,并重悬于冷稀释核缓冲液(1×)。使用Cellometer(Nexcelom)确定核数。核稀释至浓度5500核/µL,目标细胞回收率为10,000核。稀释的核悬浮液用于10×铬单细胞多组ATAC +基因表达库制备,根据制造商协议。

2.6 数据分析

为确保数据质量和可重复性,我们对神经球体培养物的RNA测序和ATAC测序数据进行了标准质量控制(QC)评估。对于RNA模态,评估了每个核检测到的基因数、总独特分子标识符(UMI)计数和线粒体读段百分比。对于ATAC模态,评估了转录起始位点(TSS)富集分数、库复杂性和峰值读段分数。所有QC指标使用Cell Ranger ARC(10x Genomics)计算,并在表S2中总结,包括每个样本的两种模态统计。这些指标用于指导下游过滤,确保仅高质量核纳入最终分析。

2.6.1 RNA-seq分析

原始RNA-seq数据经过预处理以去除噪声、校正批次效应和执行QC检查。使用Seurat的基于图聚类算法进行聚类分析以识别 distinct 细胞群体。聚类后,使用Seurat中最终分辨率0.2聚类相似核,导致识别11个 distinct 簇。基于谱系特异性标志基因表达分配簇身份如下:0: 星形胶质细胞; 1: 星形胶质细胞; 2: 兴奋性神经元; 3: 少突胶质细胞祖细胞(OPCs); 4: 抑制性神经元; 5: 内皮细胞; 6: 星形胶质细胞; 7: 循环祖细胞; 8: 少突胶质细胞; 9: 抑制性神经元; 和 10: 兴奋性神经元。使用MAST测试确定每个簇内祖源组间基因的差异表达,该测试采用广义线性模型框架,纳入复制内和跨组的细胞检测率作为协变量。DEGs定义为满足两个标准:调整后p值 < 0.05和 fold change 大于1或小于-1。与其他单核差异表达方法相比,MAST测试以其低错误和错误发现率而闻名。

2.6.2 通路分析

使用R库gprofiler进行功能富集分析。我们首先选择下调和上调基因的基因符号,使用调整后p值 < 0.05和log2FC > 0.32或 < -0.32。使用“gost”函数对每个比较执行基因集富集分析,使用京都基因与基因组百科全书(KEGG)通路数据库。使用gSCS方法进行富集分数的多重比较校正,且p-adj < 0.05的通路被认为是显著的。

2.6.3 ATAC-seq

使用ArchR软件包版本1.0.1分析snATACseq数据,如先前所述。简要来说,细胞聚类通过五次潜在语义索引(LSI)迭代执行,随后使用Harmony进行批次校正。我们创建了伪批量复制,分别合并所有EU、AF和AI样本,并通过ArchR中的addReproducibleRegionSet函数通过MACS2 callregion命令版本2.2.7.1的默认参数为每个簇内每个祖源调用区域。每个簇内每个区域的差异可及性通过ArchR getMarkerFeatures计算。

2.6.4 ATAC区域注释

使用Chipseeker R库中的“annotateRegion”函数注释区域与最近基因和基因组区域。注释在转录本水平使用GENCODE V44数据库执行,具有以下优先级:“启动子”、“5UTR”、“3UTR”、“外显子”、“内含子”、“下游”、“基因间”,且距离转录起始位点(TSS)±3 kb用于分配区域到基因启动子TSS。

2.6.5 Hi-C

原位Hi-C库按照Rao等人概述的协议构建。总之,每个库产生450至550百万 paired-end 150碱基对读段。超过270百万非冗余、独特映射、paired end读段随后用于每个库的进一步分析。接触矩阵以500、50和5 kb分辨率创建。40 kb bin的方向性指数(DI)值用于识别拓扑关联域(TAD)。为了准确映射增强子-启动子相互作用,使用HiCorr管道校正Hi-C偏倚在亚TAD水平并识别Hi-C环。

3 结果

3.1 祖源特异性iPSC和iPSC来源少突胶质细胞的生成

我们在此研究中生成了总共12个iPSC系(四个AF、四个AI和四个EU),其中六个来自AD患者,六个来自非认知受损个体。就APOE基因型而言,这12个系包括四个APOE ε4/ε4携带者和八个APOE ε3/ε3携带者。我们将这12个系分化为神经球体,产生处于不同成熟阶段的少突胶质细胞谱系细胞,从循环祖细胞到成熟髓鞘化少突胶质细胞。每个系被视为所有实验和分析的一个独立生物复制。我们未观察到系间向少突胶质细胞分化能力的显著变异性,通过第12天OLIG2染色和第55天活体O4染色评估。除了少突胶质细胞相关细胞外,球体包含神经元和星形胶质细胞,基于免疫细胞化学和snRNA-seq分析。

3.2 iPSC来源少突胶质细胞包含神经球体的单核转录组分析跨多样祖源

尝试通过FACS或 pull-down 程序从紧密簇集球体中分离单个细胞类型导致 viable 细胞低产量。为克服这些挑战并最小化细胞扰动,我们采用单核RNA测序方法使用10x Genomics Multiome平台,该平台同时从相同核捕获基因表达和染色质可及性。出于转录组分析目的,我们仅关注RNA模态。这些分析跨12个iPSC系从三个祖源群体进行。我们表征了总共47,898个细胞,平均每样本3991±1608。基于Seurat的模式识别聚类识别了所有 individual 样本共享的七个细胞簇。我们随后检测了每个簇中富集的基因,并利用这些为每个 individual 簇分配细胞类型。我们识别了一个iPSC来源OPC(iOPC)簇(富集表达CSPG4、PDGFRA、COL20A1、OLIG1、OLIG2和PTPRZ1)和一个iPSC来源少突胶质细胞(iOL)簇(MAG、MOG、CLDN11、ENPP6、MYRF和MBP) among 其他细胞类型,包括星形胶质细胞、兴奋性和抑制性神经元、内皮细胞和循环祖细胞。我们未发现每个簇中细胞比例跨祖源的显著差异,表明分化效率未受此变量影响。

3.3 祖源间DEGs

为了调查我们培养物中少突胶质细胞转录组中祖源相关变化,我们使用OPC和少突胶质细胞簇的 pairwise 比较独立进行了差异基因表达分析。在iOPC簇中,我们发现DEGs数量在EU对AI比较中最大,总共1750个DEGs,且约90%(1573)在EU样本中增加。另一方面,在iOL簇中,DEGs数量在AF和AI系间最大,有492个DEGs,其中约87%(427)在AF系中增加。为了识别少突胶质细胞谱系共同的DEGs,我们分析了数据以识别每个比较中两个簇中重叠的DEGs。

3.4 AD中祖源依赖性变化

我们将不同比较中获得的DEGs与当前作为AD GWAS位点的基因进行了比较。我们在iOPC簇中发现了11个AD GWAS基因(ALCAM、APP、COX7C、EGFR、GPC6、MYO15A、PLCG2、RTN1、SEC61G、SORL1和TMEM106B)在祖源间差异表达。另一方面,在iOL簇中,仅五个AD GWAS命中差异表达:ADAM17、CLU、EPDR1、FGF12、MAF和WWOX。一个额外的有趣DEG是OPCML,一个最近与AD linked 的基因;在这种情况下,我们发现它在EUs中与AFs相比增加。

3.5 男性对女性表达

我们的大多数样本是女性,除了AI系中的两个男性。虽然这是一个小数量的男性个体,但他们可能将性别驱动的影响引入单细胞RNAseq的总祖源分析中。因此,我们执行了一个排除两个男性个体的分析。具体来说,我们比较了两个AI女性与四个AF女性

生物通微信公众号
微信
新浪微博


生物通 版权所有