利用机器学习和孟德尔随机化结合实验验证鉴定类风湿关节炎线粒体枢纽基因

时间:2026年3月30日
来源:Journal of Inflammation Research

编辑推荐:

本研究针对类风湿关节炎(RA)复杂的病理机制,特别是线粒体功能紊乱的关键作用尚不明确的问题,研究人员综合运用生物信息学、机器学习和孟德尔随机化等方法,筛选出UCP2、BCL2A1、FASN、AKR1B10、IFI27和PDK1这6个潜在的线粒体相关诊断生物标志物,并构建了具有良好鉴别能力的诊断模型。孟德尔随机化分析进一步证实了BCL2A1与RA之间的因果关系。该研究为理解RA的线粒体驱动病理机制提供了新视角,并为精准诊断和治疗靶点探索提供了新的候选基因。

广告
   X   

类风湿关节炎的“能量工厂”迷航记:人工智能如何揪出致病的“内鬼基因”?
关节的红肿、热痛、晨僵,甚至令人束手无策的关节变形……这一切的背后,是类风湿关节炎(RA)这位“不死的癌症”在作祟。作为全球发病率约1%的自身免疫性疾病,RA的病理机制极其复杂,是遗传、环境、免疫等多因素交织的结果。尽管治疗手段在不断进步,但部分患者仍难以达到低疾病活动度,且长期用药的副作用不容忽视。近年来,科学家们将目光投向了细胞的“能量工厂”——线粒体。越来越多的证据表明,线粒体功能紊乱是RA发生与发展的关键推手,它通过影响免疫细胞和非免疫细胞的生存、活化与分化,维持关节局部的慢性炎症微环境,甚至促进骨破坏。然而,究竟有哪些关键的线粒体相关基因在其中扮演核心角色,它们又如何成为RA的潜在诊断标记或治疗靶点,这仍是一个亟待解开的谜团。针对这一科学难题,一篇发表在《Journal of Inflammation Research》上的研究,巧妙地融合了人工智能、遗传学分析和实验验证,为我们揭示了RA中线粒体的秘密,并指明了精准干预的新方向。
为了系统性地解答上述问题,研究人员采用了多步骤、多技术整合的研究策略。首先,他们从GEO数据库获取了RA患者和健康对照的基因表达谱数据,运用差异表达分析和批效应校正,筛选出与线粒体功能相关的差异表达基因。接着,他们构建了一个“人工智能筛选漏斗”,依次应用三种机器学习算法——LASSO回归、支持向量机递归特征消除(SVM-RFE)和随机森林,对庞大的基因列表进行层层筛选,最终锁定少数核心的“枢纽基因”。基于这些枢纽基因,研究人员建立了一个诊断模型,并利用外部独立数据集(GSE93272)评估其泛化能力。为了探究这些基因与疾病的因果关系,他们进一步采用了孟德尔随机化(MR)这一强大的遗传学工具,利用大规模人群遗传数据,评估基因表达对RA风险的因果效应。此外,研究还进行了免疫细胞浸润分析、药物富集分析、分子对接模拟,以探讨枢纽基因的生物学功能和潜在的治疗应用。最后,为了初步验证生物信息学分析的发现,研究人员对来自3名RA患者和3名创伤对照的滑膜组织样本,进行了实时定量PCR(RT-qPCR)检测,并通过留一法交叉验证评估了小样本结果的稳定性。
研究结果
  • 鉴定RA中的线粒体相关差异表达基因
    通过对训练集数据进行批效应校正和差异分析,研究人员共鉴定出1,432个差异表达基因,其中812个上调,620个下调。将这些基因与人类线粒体基因数据库MitoCarta 3.0取交集,最终得到了39个与线粒体功能相关的差异表达基因,为后续分析奠定了基础。
  • 富集分析揭示线粒体功能异常
    基因富集分析显示,RA组在细胞粘附分子、趋化因子信号通路等炎症相关通路上显著富集,而对照组则在脂联素信号通路、胰岛素信号通路等代谢相关通路上富集。对线粒体相关差异基因的GO和KEGG分析进一步表明,这些基因在脂肪酸代谢、AMPK信号通路以及线粒体外膜、氧化还原酶活性等功能上显著富集,提示RA中存在线粒体稳态失衡,涉及结构和代谢功能的双重异常。
  • 机器学习识别枢纽基因并构建诊断模型
    通过整合LASSO回归、SVM-RFE和随机森林三种机器学习方法的结果,研究成功鉴定出6个线粒体相关枢纽基因:UCP2、BCL2A1、FASN、AKR1B10、IFI27和PDK1。基于这6个基因构建的逻辑回归诊断模型,在训练集内展现出优异的区分能力,其受试者工作特征曲线下面积(AUC)高达0.976。在独立的外周血验证集(GSE93272)中,该模型的AUC仍达到0.709,证明了其良好的泛化能力和潜在的临床转化价值。
  • 免疫浸润分析与基于枢纽基因的分子分型
    通过Cibersort算法分析发现,RA患者的滑膜组织中存在显著的免疫细胞组成变化。相关性分析显示,筛选出的6个枢纽基因与多种免疫细胞(如中性粒细胞、活化记忆CD4+T细胞等)存在显著关联。例如,BCL2A1与中性粒细胞呈显著正相关,提示其可能通过抑制中性粒细胞的线粒体凋亡途径,延长促炎细胞的生存,从而加剧炎症。此外,根据枢纽基因的表达谱,可以将RA患者分为两个具有不同免疫特征的亚型(C1和C2),其中C1亚型表现出更高水平的活化记忆CD4+T细胞、调节性T细胞(Tregs)和M2型巨噬细胞浸润。这为理解RA的免疫异质性和开发亚型特异性疗法提供了分子依据。
  • 孟德尔随机化分析验证因果关联
    为了验证枢纽基因与RA之间是否存在因果关系,研究采用了双样本孟德尔随机化分析。结果显示,基因预测的BCL2A1表达水平升高与RA患病风险增加存在显著的因果关联,其比值比为1.37。该结果未检测到显著的异质性或多效性,留一法敏感性分析也证实了结果的稳健性。这为BCL2A1作为RA潜在风险因子提供了遗传学证据。
  • 药物富集与分子对接探索治疗潜力
    通过对枢纽基因进行药物富集分析,研究发现非诺贝特与AKR1B10高度相关,甲苯叔丁胺与BCL2A1高度相关。进一步的分子对接模拟显示,非诺贝特与AKR1B10蛋白的结合能为-9.7 kcal/mol,而甲苯叔丁胺与BCL2A1蛋白的结合能为-5.5 kcal/mol,为将这些现有药物“老药新用”于RA治疗提供了初步的理论依据。
  • 初步实验验证枢纽基因表达
    对少量临床滑膜组织样本进行RT-qPCR验证,结果显示BCL2A1、FASN、AKR1B10、IFI27和PDK1这5个基因的表达趋势与生物信息学分析结果一致。通过留一法敏感性分析证实,这5个基因的表达差异趋势稳定,表明结果具有良好的可靠性,初步支持了这些枢纽基因作为RA潜在诊断标志物的可能性。
结论与讨论
本研究通过整合生物信息学、机器学习和孟德尔随机化分析,系统性地揭示了线粒体相关基因在RA发病中的关键作用。研究成功鉴定出UCP2、BCL2A1、FASN、AKR1B10、IFI27和PDK1这6个核心枢纽基因,并构建了具有良好诊断性能的模型。该模型不仅在滑膜组织训练集上表现优异,在外周血验证集中也显示出一定的泛化能力,为开发基于外周血的RA早期诊断工具提供了新思路。
孟德尔随机化分析为BCL2A1与RA之间的因果关联提供了强有力的遗传学证据,使其成为一个有前景的致病风险因子和治疗靶点。药物富集和分子对接结果则提示,非诺贝特和甲苯叔丁胺等药物可能与这些靶点结合,为药物重定位提供了候选分子。
尽管部分基因(如UCP2、BCL2A1)在RA中的角色已有零星报道,但本研究首次从线粒体功能紊乱这一核心病理特征出发,通过多算法交叉筛选和因果推断,系统地构建了一个与RA相关的线粒体基因网络。这为理解RA的“线粒体驱动”病理机制提供了全新的整合视角。研究也指出了现有发现的局限性,如初步实验验证的样本量较小、诊断模型的跨组织验证、以及分子对接结果需进一步的功能实验证实等。未来的研究方向应集中于扩大样本进行多中心临床验证,并利用细胞和动物模型深入探究这些枢纽基因的具体功能机制,以及相关候选药物的实际疗效,从而为RA的精准诊断和靶向治疗奠定更坚实的科学基础。

生物通微信公众号
微信
新浪微博


生物通 版权所有