基于多组学数据和机器学习的急性心肌梗死衰老相关基因诊断特征识别与分析

时间:2026年6月5日
来源:Frontiers in Immunology

编辑推荐:

背景:急性心肌梗死(acute myocardial infarction,AMI)发病率随人口老龄化而升高,同时伴随细胞衰老(cellular senescence)加剧;然而,具有临床价值的AMI衰老相关基因(senescence-related gene

广告
   X   

背景:急性心肌梗死(acute myocardial infarction,AMI)发病率随人口老龄化而升高,同时伴随细胞衰老(cellular senescence)加剧;然而,具有临床价值的AMI衰老相关基因(senescence-related genes,SRGs)仍 poorly defined。本研究旨在识别与AMI相关的SRGs,并构建用于诊断评估和患者分层的多维模型。方法:整合包含106例AMI患者和76例对照的转录组数据集进行差异表达分析和加权基因共表达网络分析(weighted gene co-expression network analysis,WGCNA)。一个包含37例AMI病例和15例对照的外部独立验证队列用于进一步评估。应用四种机器学习算法识别诊断性SRGs。所选基因在批量RNA测序(bulk RNA-seq)、单细胞RNA测序(single-cell RNA-seq,scRNA-seq)、蛋白质组学数据和小鼠心肌梗死模型中进行验证。基于这些基因,研究人员构建了三种SRG基础模型:诊断分类器、患者分层系统和衰老评分系统。结果:共识别出13个AMI相关SRGs,其中FOS、SOD2、MXD1和GRN四个基因在不同数据集中显示出一致的诊断相关性。四基因诊断模型受试者工作特征曲线下面积(area under the curve,AUC)达0.808,并显示出良好的临床净获益。患者分层识别出一个富含抗炎细胞的低衰老组和一个以促炎中性粒细胞浸润为特征的高衰老组。衰老评分与中性粒细胞浸润呈中度正相关。结论:本研究将FOS、SOD2、MXD1和GRN确定为候选AMI相关衰老生物标志物,并建立了基于SRG的AMI诊断和分层初步模型。这些发现表明,富含中性粒细胞的炎症反应与AMI中的衰老相关转录特征相关,并为未来关于衰老相关通路在个性化AMI管理中作用的研究提供了框架。
该研究聚焦于急性心肌梗死(AMI)中细胞衰老相关基因的系统性识别及其临床转化应用,发表于《Frontiers in Immunology》。随着全球老龄化进程加速,AMI发病率持续攀升,而细胞衰老作为衰老与心血管疾病的关键桥梁环节,其在AMI中的分子机制和临床价值尚未得到充分阐明。当前研究主要停留在细胞衰老表型描述层面,缺乏对衰老相关基因(senescence-related genes,SRGs)的系统识别与验证,尤其缺乏具有诊断价值的SRGs及相应的临床转化模型。为此,研究人员整合多组学数据,通过机器学习方法筛选核心诊断基因,并构建了多维度的临床决策工具。

研究首先获取并整合了来自基因表达综合数据库(Gene Expression Omnibus,GEO)的四个AMI转录组数据集(GSE34198、GSE48060、GSE60993、GSE29111),其中前三个数据集合并后经批次效应校正作为训练集(106例AMI,76例对照),GSE29111作为外部独立验证队列(37例AMI,15例对照)。同时,从iProx数据库获取蛋白质组学数据集PXD062794(48例AMI,50例对照),以及从CellAge数据库获取包含307个基因的衰老基因集。小鼠模型方面,采用8周龄和18月龄雄性C57BL/6小鼠,通过左前降支(left anterior descending,LAD)冠状动脉结扎建立心肌梗死(myocardial infarction,MI)模型,分别进行探索性RNA测序(RNA sequencing,RNA-seq)及定量PCR(quantitative PCR,qPCR)和蛋白质免疫印迹(western blot)验证。此外,还利用了单细胞转录组数据集GSE163129(5例,40,314个细胞)。

关键技术方法包括:差异表达基因分析(differential expression gene analysis)采用|倍数变化(fold change,FC)|≥1.2且P<0.05作为筛选阈值;加权基因共表达网络分析(weighted gene co-expression network analysis,WGCNA)识别与AMI显著相关的基因模块,软阈值β=16(R²=0.86);四种机器学习算法包括eXtreme Gradient Boosting(XGBoost)、随机森林(Random Forest)、Lasso回归和梯度提升机(Gradient Boosting Machine,GBM),采用"最大间隙截断"策略筛选特征基因交集;多变量logistic回归构建诊断模型,并计算风险评分(Risk=Σβi×Expri);决策曲线分析(decision curve analysis,DCA)评估临床净获益;共识聚类(consensus clustering)进行患者分层;单样本基因集富集分析(single-sample gene set enrichment analysis,ssGSEA)构建AMI衰老相关评分(AMI senescence-related scores,ASS);ImmuCellAI算法分析免疫细胞浸润;Seurat工具处理单细胞数据,统一流形近似与投影(uniform manifold approximation and projection,UMAP)进行降维可视化。

**衰老相关基因的识别**:通过对批量转录组数据的差异表达分析,研究人员识别出313个差异表达基因(differentially expressed genes,DEGs),这些基因主要富集于细胞周期停滞、炎症反应和肿瘤坏死因子(tumor necrosis factor,TNF)信号通路等衰老和炎症相关通路。WGCNA分析在软阈值β=16时建立了无标度网络拓扑结构,识别出4个稳定的基因模块,其中蓝色模块和青色模块与AMI状态的关联最为显著(相关系数分别为0.24和0.23,均P<0.001)。将DEGs、两个关键模块的枢纽基因与CellAge衰老基因集取交集,最终获得13个高置信度AMI相关衰老基因(senescence-related genes,SRGs)。

**诊断性衰老相关基因的确定**:单变量logistic回归分析显示SOD2表达升高与AMI风险显著相关(比值比(odds ratio,OR)=3.410)。四种机器学习算法独立筛选特征基因后取交集,确定FOS、SOD2、MXD1和GRN为诊断性SRGs。基于这四基因构建的多变量logistic诊断模型,其受试者工作特征曲线下面积(area under the curve,AUC)为0.808,决策曲线分析显示在广泛的阈值范围内具有良好的临床净获益。外部验证队列GSE29111中AUC为0.749(95%置信区间(confidence interval,CI):0.611-0.886)。列线图(nomogram)直观展示了各基因在模型中的权重贡献。

**多维度数据验证**:在训练集和验证集的批量RNA-seq数据中,四个诊断性SRGs在AMI组均呈一致高表达。单细胞数据集GSE163129分析同样证实这些基因在AMI组显著上调。小鼠模型验证方面,8周龄MI小鼠梗死区心肌组织的探索性RNA-seq显示Fos、Mxd1、Sod2和Grn均上调;18月龄老龄MI小鼠的外周血白细胞qPCR验证显示这四个基因在MI组显著升高(n=6/组),梗死区心肌的western blot证实GRN、c-FOS、MXD1和SOD2蛋白水平上调。人类外周血蛋白质组学数据集PXD062794分析显示SOD2蛋白在AMI患者中显著增加,其诊断效能AUC为0.764。

**免疫浸润特征分析**:基于诊断模型风险评分的免疫细胞浸润分析显示,低风险组富含抗炎细胞(如诱导型调节性T细胞(induced regulatory T cells,iTreg)),而高风险组以促炎细胞(包括辅助性T细胞17(T helper 17,Th17)、巨噬细胞和中性粒细胞)浸润为主。风险评分与中性粒细胞浸润呈中度正相关(Spearman R=0.456,P<0.001),与其他促炎细胞亦呈正相关,而与CD8+ T细胞、耗竭性T细胞、iTreg等呈负相关。

**患者分层系统构建**:基于13个SRGs的共识聚类分析确定最优聚类数k=2。聚类结果将AMI患者分为两个亚群:C1为低衰老特征群,C2为高衰老特征群。差异表达分析共获得C1与C2之间的差异基因,与SRGs取交集得到6个关键基因(包含4个诊断性SRGs),这些基因在C2中均高表达。免疫浸润分析显示C1富含自然调节性T细胞(natural regulatory T cells,nTreg)和iTreg等抗炎细胞,而C2中Th17、巨噬细胞和中性粒细胞等促炎细胞显著增多,尤以中性粒细胞浸润差异最为显著。功能富集分析表明C1差异基因主要涉及白细胞活化负调控、转化生长因子-β(transforming growth factor-β,TGF-β)信号和Treg细胞分化等抗炎通路,而C2则富集于髓系白细胞活化、中性粒细胞活化、TNF信号和Toll样受体(Toll-like receptor)信号等促炎通路。

**衰老评分系统及应用**:基于四个诊断性SRGs的ssGSEA评分(即AMI衰老相关评分,ASS)在AMI样本中显著高于对照,AUC达0.826,10折交叉验证显示良好的稳定性和泛化性。高ASS组中诊断性SRGs显著上调,且中性粒细胞、巨噬细胞和部分T细胞亚群显著富集,而树突状细胞和B细胞呈减少趋势。单细胞水平分析显示ASS在巨噬细胞和中性粒细胞等促炎细胞群体中评分较高,四个核心基因亦主要富集于中性粒细胞,提示衰老相关转录信号与中性粒细胞激活及促炎反应密切相关。

**讨论部分总结**:该研究的创新性主要体现在三个方面。第一,方法学上整合差异分析、WGCNA和多种机器学习算法,通过交叉验证避免单一算法偏倚,并在批量RNA-seq、scRNA-seq、蛋白质组学和小鼠模型中进行多维度验证,确保了生物标志物的可靠性。第二,构建了包括诊断模型、患者分层系统和衰老评分系统在内的多维临床决策工具,从诊断、分类和评分三个维度评估患者AMI状态,其中风险模型、ASS和分子亚型分别代表通路活性表征、诊断预测和患者分层,功能互补。第三,从生物学机制角度,四个核心基因分别对应细胞衰老过程的不同维度:FOS作为衰老相关分泌表型(senescence-associated secretory phenotype,SASP)形成的关键转录调控因子,在缺血缺氧和炎症刺激下快速激活,与JUN形成激活蛋白-1(activator protein-1,AP-1)转录复合物,通过DNA损伤反应(DNA damage response,DDR)和核因子-κB(nuclear factor-κB,NF-κB)信号协同增强SASP相关基因转录;SOD2从抗氧化防御向线粒体衰老标志转变,早期上调以清除活性氧(reactive oxygen species,ROS),但长期ROS累积导致线粒体功能障碍,其持续高表达反映"代偿但无效"的抗氧化状态;MXD1拮抗MYC诱导细胞周期停滞,在AMI相关缺氧和炎症微环境中通过竞争性结合MAX抑制MYC依赖性转录活性,下调细胞增殖相关基因,导致G1期阻滞;GRN通过溶酶体功能和炎症调控维持衰老表型,其异常功能导致溶酶体-自噬通路受损,引起蛋白质累积和细胞内稳态破坏,同时参与调控炎症因子分泌以维持SASP网络。这四个基因共同构成了AMI背景下多维整合的衰老调控网络,而非单纯反映一般性炎症反应。

关于免疫调控机制,研究发现低ASS组富含抗炎细胞,而高ASS组以中性粒细胞等促炎细胞浸润为特征。单细胞分析经Benjamini-Hochberg错误发现率(false discovery rate,FDR)校正后确认SRGs主要富集于中性粒细胞。然而,这些发现主要为相关性结果,尚不能确定SRGs是否直接驱动中性粒细胞募集或激活,也不排除中性粒细胞来源的炎症介质和氧化应激反过来促进衰老相关转录改变的可能性。

研究局限性包括:公共数据库样本量有限,未来需扩大样本并补充更多单细胞和蛋白质组学数据;尽管有小鼠模型和患者测序数据验证,但缺乏真实世界临床样本中诊断效能的充分验证;人类发现队列来自外周血转录组,反映的是白细胞相关信号而非直接心肌衰老,与小鼠心肌梗死模型中心肌组织验证存在跨隔室差异;8周龄小鼠主要反映年轻成年动物的急性损伤反应,虽补充了18月龄老龄小鼠验证,但仍未能完全复现人类AMI的年龄依赖性衰老背景;候选基因的蛋白质表达未在独立临床外周血样本中验证,ASS和分层系统的预后价值尚待纵向临床随访确立。

**研究结论**:本研究通过整合多组学数据识别了13个AMI相关衰老基因及4个核心诊断基因(FOS、SOD2、MXD1、GRN),构建了包括诊断模型、患者分层系统和衰老评分系统在内的基于SRGs的新型模型,在AMI中显示出良好的预测性能和分层潜力。机制上,免疫细胞尤其是中性粒细胞可能与AMI中的炎症激活和衰老相关转录程序相关。该研究为AMI诊断提供了候选生物标志物,为阐明衰老相关AMI的具体机制奠定了基础,并有望通过所构建的模型为AMI的早期诊断、治疗和个性化管理做出贡献。

生物通微信公众号
微信
新浪微博


生物通 版权所有