基于机器学习探索共突变与单突变对慢性粒-单核细胞白血病急变转化的预测价值

时间:2026年4月13日
来源:Blood Cancer Journal

编辑推荐:

本研究为突破慢性粒-单核细胞白血病(CMML)现有风险模型仅关注单一突变的局限,通过机器学习算法系统分析了共突变相互作用对急变转化(BT)的影响。研究人员对梅奥诊所605例CMML患者进行分层聚类与生存分析,鉴定出多个对预后有独立影响的特定突变(如NPM1)及其组合(如“NRAS+SETBP1”),其预测效力在外部队列中得到验证,为未来风险模型的构建提供了新视角。

广告
   X   

在血液肿瘤的世界里,慢性粒-单核细胞白血病(CMML)是一种颇为“狡猾”的疾病。它介于骨髓增生异常综合征(MDS)和骨髓增殖性肿瘤(MPN)之间,一部分患者会相对稳定,而另一部分则会进展为急性髓系白血病(AML),即发生急变转化(BT),这是导致患者死亡的主要原因。然而,预测哪些患者会走向急变,一直是个巨大挑战。现有的风险分层模型大多依赖于临床特征和血细胞计数,即便引入了基因突变信息,也主要是“单打独斗”地评估单个基因的影响。但在肿瘤的发生发展中,基因突变往往是“拉帮结派”、协同作案的。那么,在CMML中,特定的基因突变组合是否会“狼狈为奸”,更凶猛地驱动疾病恶化?这个问题,传统的统计方法难以系统回答。
为此,来自梅奥诊所等机构的研究团队在《Blood Cancer Journal》上发表了一项研究。他们决心用更智能的方法——机器学习算法,来充当“基因侦探”,深入挖掘CMML基因蓝图中那些“危险关系”,以揭示共突变对急变转化的真实影响,为更精准的预后预测铺平道路。
为了开展这项研究,研究人员主要应用了以下关键技术方法:首先,他们构建了一个包含605名梅奥诊所CMML患者的研究队列,对其进行了系统的靶向测序以获取基因突变谱。随后,他们开发并应用了一种专门用于患者分层、基于生存结局和基因组改变共现模式的层次聚类机器学习算法,来识别具有不同预后的分子亚群。最后,他们通过多变量Cox比例风险回归分析,来独立评估特定突变或突变组合对急变转化风险的贡献,并在一个独立的、包含501名患者的意大利外部队列中对关键发现进行了验证。
研究结果
通过机器学习鉴定出五个具有显著不同急变转化风险的分子簇
研究团队首先利用一种基于生存和突变共现的层次聚类算法,对605名患者进行了无监督分析。算法成功地将患者分成了5个具有显著不同临床结局的分子簇。这五个簇的3年急变转化率差异巨大,从0%到100%不等,其预测模型在3年时间的曲线下面积(AUC)达到了0.78,显示出强大的区分能力。这表明,综合考虑基因突变之间的“关系网”,远比看单个突变能更有效地对患者进行风险分层。
特定单突变及共突变组合对急变风险具有独立的负面影响
为了厘清是哪些具体的突变“搭档”在作祟,研究者进行了多变量Cox回归分析。结果发现,多个特定的基因突变或其组合是急变转化的独立不良预后因素。其中,危害最大的当属NPM1基因突变,其风险比(HR)高达26.7。紧随其后的是一些致命的“组合拳”,包括“NRAS+SETBP1”共突变(HR 12.6)、“ASXL1+BCOR”共突变(HR 8.4)、“ASXL1+RUNX1”共突变(HR 2.2)。此外,JAK2单突变(HR 2.1)和“ASXL1+TET2”共突变(HR 1.7)也显示出显著的风险。有趣的是,研究也发现了一个可能的“保护性”组合:“PHF6突变且ASXL1为野生型”的患者,其急变风险极低(HR 5.61x10-10)。这些数据清晰地表明,某些突变组合的破坏力远大于单个突变之和,凸显了共突变分析的重要性。
NPM1突变型CMML具有独特的基因型和预后特征
鉴于NPM1突变显示出最强的风险信号,研究进一步对比了NPM1突变型与野生型患者的共存突变模式。分析揭示,NPM1突变患者极少与ASXL1(0% vs. 43%)、RUNX1(0% vs. 17%)和SRSF2(7% vs. 39%)等典型CMML相关突变共存,但却高度富集DNMT3A突变(71% vs. 7%)。这种独特的突变谱提示,携带NPM1突变的CMML在生物学上可能更接近AML,而非典型的CMML,这或许解释了其侵袭性极强的临床行为。
在独立外部队列中验证关键遗传标志物的预后价值
任何重要发现都需要经受“重复”的检验。研究团队在另一个来自意大利的、包含501名CMML患者的独立队列中,对上述分析中筛选出的关键遗传标志物进行了验证。结果证实,“NRAS+SETBP1”共突变、“ASXL1+RUNX1”共突变、NPM1单突变以及BCOR单突变,在这个外部人群中同样是预测急变转化的强力指标。这一验证步骤极大地增强了研究结论的可靠性和普适性。
研究结论与讨论
本研究通过创新的机器学习方法,系统性地揭示了慢性粒-单核细胞白血病(CMML)中基因共突变模式对疾病急变转化(BT)的关键驱动作用。其主要结论和重要意义在于:
首先,研究证实了“预后相互作用”在CMML中的重要性。与当前主流风险模型只关注单一突变不同,本工作证明特定的突变组合(如“NRAS+SETBP1”、“ASXL1+BCOR”)会产生协同效应,极大增加急变风险。这意味着,未来的风险模型必须从“单个球员”的评分,转向分析“球队阵容”的协作与对抗关系,才能实现更精准的预后判断。
其次,研究明确将NPM1突变定位为CMML中一个极端高危的分子标志物。不仅其本身风险比极高,而且其独特的共存突变模式(富集DNMT3A,排斥ASXL1、SRSF2等)表明,这类疾病在分子本质上可能更接近于急性髓系白血病(AML),而非经典的CMML。这一发现对临床实践具有直接指导意义,提示对携带NPM1突变的CMML患者,可能需要采取更接近于AML的积极治疗策略和监测频率。
最后,研究所鉴定的多个危险共突变模式在外部队列中得到成功验证,标志着这些生物标志物具有潜在的临床转化价值。它们为开发新一代整合了共突变信息的CMML预后评分系统奠定了坚实的分子基础。总之,这项研究不仅加深了人们对CMML疾病生物学机制的理解,更从方法学上示范了如何利用机器学习挖掘基因组数据的深层联系,为实现血液肿瘤的个体化、精准化医疗提供了新的工具和视角。

生物通微信公众号
微信
新浪微博


生物通 版权所有