驱动基因突变和临床特征可预测非小细胞肺癌(NSCLC)的骨转移风险:一项逻辑回归模型研究

时间:2026年2月21日
来源:Cancer Genetics

编辑推荐:

骨转移是非小细胞肺癌(NSCLC)患者预后的重要影响因素,本研究通过回顾性分析362例东亚人群NSCLC患者,发现EGFR突变(尤其是19-Del和L858R亚型)与骨转移风险显著相关(OR=2.395和2.228),而KRAS、ALK等其他驱动基因无显著关联。结合临床病理特征(T/N分期、腺癌类型),构建的机器学习模型(LASSO回归+SHAP解释)对同步骨转移(AUC=0.704)和1年内转移的预测效能稳定,验证了EGFR作为早期骨转移分子标志物的关键作用。

广告
   X   

郭海梅|何双|程娇|杨慧|钟晓武
中国四川省南充市北川医学院附属医院临床实验室,637000

摘要

骨转移影响了大约40%的非小细胞肺癌(NSCLC)患者,显著影响了患者的生存率和预后。然而,驱动基因突变与骨转移之间的分子机制仍不甚清楚。本研究回顾性分析了362名东亚地区的NSCLC患者,以探讨这种关联,并基于机器学习构建了一个预测模型。EGFR突变是最常见的基因改变(57.7%),并与骨转移的风险显著相关,其中同步转移的比值比为2.395,诊断后一年内转移的比值为2.228。在EGFR亚型中,19-Del和L858R与骨转移的关联最强。相比之下,其他常见的驱动基因突变,如KRAS和ALK,与骨转移没有显著关联。此外,晚期T期(T3-T4)、晚期N期(N2-N3)和腺癌组织类型也是骨转移的重要风险因素。使用LASSO回归选择的预测因子构建的逻辑回归模型表现出最佳和稳定的性能,验证集的AUC分别为同步骨转移的0.704和诊断后一年内转移的0.708。SHAP分析显示,T期和EGFR突变状态对模型的预测贡献最大。这些发现表明EGFR突变是NSCLC早期骨转移的关键分子驱动因素。将分子标志物与临床特征整合到一个可解释的预测模型中,可以改善骨转移的个性化风险评估,并促进及时干预。

引言

肺癌是全球癌症相关死亡的主要原因,非小细胞肺癌(NSCLC)占病例的80%以上[1]。骨是NSCLC的主要转移部位,约40%的患者在诊断时已有骨转移[[2]],[3]],[4]],[5]]。这些转移常常导致骨骼相关事件(SREs),包括病理性骨折、高钙血症和脊髓压迫,使总体生存期缩短至8-12个月,并严重损害生活质量[[5]],[6]],[7]]。这些观察结果强调了早期检测和干预策略的迫切需要。
肿瘤转移是一个高度复杂且非随机的过程,表现出明显的器官趋向性[[8]],[9]]。这一现象可以通过Paget的“种子和土壤”假说来部分解释,该假说认为癌细胞的扩散取决于肿瘤细胞(“种子”)与远端器官微环境(“土壤”)之间的动态相互作用[[9]],[10]]。转移部位受多种因素影响,包括解剖位置、细胞起源和分子亚型[[11]],[12]],[13]]。支持这一概念的研究包括Nguyen B等人对25,000名转移性肿瘤患者的基因谱和临床数据的分析[11],以及Jiang B等人对32,176名原发性和转移性癌症患者的临床和测序数据的整合分析[13]。这两项研究都显示了基因改变与转移模式之间的明确关联,进一步阐明了器官特异性转移的分子基础。
随着对NSCLC分子机制理解的深入和基因检测技术的发展,已经识别出越来越多的驱动基因突变。已知的重点驱动基因包括表皮生长因子受体(EGFR)、Kirsten鼠肉瘤病毒癌基因同源物(KRAS)、间变性淋巴瘤激酶(ALK)和v-raf鼠肉瘤病毒癌基因同源物B1(BRAF)等。这些驱动基因突变的分子基因分型通过实现靶向治疗彻底改变了NSCLC的治疗范式,与传统方法相比显著提高了患者的生存率[[14]],[15]]。因此,驱动基因的分子谱型分析已成为NSCLC患者标准临床管理不可或缺的一部分。
尽管NSCLC中的驱动基因突变是靶向治疗反应的已知决定因素,但它们与骨转移的关联仍不甚明确。为填补这一知识空白,我们研究了常见NSCLC驱动基因突变与骨转移发生率之间的关系。此外,我们开发了一个综合临床预测模型,结合了这些基因标志物和其他相关临床参数,以分层NSCLC患者的骨转移风险。

患者和数据收集

这项回顾性研究招募了362名具有东亚血统的NSCLC患者,他们在2019年1月至2024年8月期间在我们的机构接受了临床治疗,并通过病理学确诊。从医疗记录中提取了全面的临床数据,包括人口统计特征、病理诊断、骨转移状态(通过影像学确认)和随访结果。肿瘤分期根据第8版UICC/AJCC TNM标准确定

分子特征

如图1所示,在362名NSCLC患者中,76.2%(n = 276例)检测到基因突变。值得注意的是,EGFR突变的患病率最高,为57.7%(n = 209例)。其他基因的突变频率如下:KRAS(n = 29,8.0%)、ALK(n = 20,5.5%)、BRAF(n = 7,1.9%)、HER2(n = 6,1.7%)、RET(n = 6,1.7%)、MET(n = 5,1.4%)、ROS1(n = 5,1.4%)、PIK3CA(n = 3,0.8%)和NRAS(n = 2,0.6%)。此外,总共

讨论

癌症是一种多步骤疾病,涉及多种基因的改变。证据表明,驱动基因突变通过多种生物学机制促进肿瘤转移[[19]],[20]],[21]],[22]],[23]],[24]],[25]]。基于此背景,本研究旨在阐明驱动基因突变与NSCLC骨转移发展之间的具体关联。
我们队列中EGFR突变的高患病率(57.7%)与已知的突变谱一致

结论

总之,我们的研究表明,EGFR突变,特别是19-Del和L858R外显子突变,是NSCLC早期骨转移的关键分子驱动因素。我们开发了一个可解释的逻辑回归模型,将EGFR状态与关键的临床病理学因素(T期、N期、腺癌)相结合,该模型表现出中等但稳定的预测性能,并且在临床相关阈值范围内具有积极的净效益,决策曲线分析也证实了这一点。

作者贡献

郭海梅和钟晓武构思并设计了这项研究。何双、程娇和杨慧负责数据收集。郭海梅和何双进行了统计分析并解释了数据。程娇和杨慧完善了图表。郭海梅和钟晓武起草了手稿并进行了修订。郭海梅和钟晓武获得了这项研究的资金,并负责项目管理。所有作者都仔细审阅了

伦理声明

伦理声明:该研究方案已获得北川医学院附属医院的机构审查委员会批准

资金支持

本研究得到了南充市科技战略合作项目(项目编号22SXQT0290)、四川省医学科学技术创新研究协会(项目编号2025YCZD110)、北川医学院附属医院科学研究发展计划项目(项目编号2024PTZK004)以及北川医学院科学研究发展计划项目(项目编号CBY21-QA01)的支持。

数据可用性声明

本研究生成和分析的去标识化参与者数据可在合理请求下从通讯作者处获得。数据共享需遵守已完成的数据使用协议,并获得相关机构审查委员会的批准,以便进行外部验证和进一步研究。

CRediT作者贡献声明

郭海梅:写作 – 审稿与编辑,撰写原始草案,项目管理,资金获取,正式分析,概念构思。何双:调查,正式分析。程娇:可视化,调查。杨慧:可视化,调查。钟晓武:写作 – 审稿与编辑,撰写原始草案,项目管理,资金获取,概念构思。

生物通微信公众号
微信
新浪微博


生物通 版权所有