基于机器学习的甲状腺癌骨/肺转移预测模型:提升风险分层的精准度

时间:2025年9月9日
来源:Frontiers in Endocrinology

编辑推荐:

这篇研究通过机器学习(XGBoost等算法)构建了分化型甲状腺癌(DTC)骨/肺转移预测模型,利用SEER数据库(N=13,296)和中国验证队列(N=255),AUC达0.988/0.866。LASSO回归筛选出肿瘤大小、放疗等9个关键变量,SHAP分析揭示肿瘤≥2cm为最强预测因子,并开发了临床可用在线计算器。

广告
   X   

背景:

分化型甲状腺癌(DTC)发病率在全球范围内快速上升,虽然多数患者预后良好,但约1.98%会发生骨或肺转移,显著恶化生存结局。现有预测模型依赖基础临床因素,准确性有限。这项研究创新性地应用机器学习技术,通过SEER数据库(2018-2021年)13,296例患者数据,构建了首个同步预测骨/肺转移的智能模型。

方法:

研究采用六种机器学习算法(XGBoost、随机森林等),通过LASSO回归筛选出9个核心变量:肿瘤大小(≥2cm影响最显著)、放疗、手术方式、组织学类型、T/N分期等。针对数据不平衡问题,采用SMOTE过采样技术处理。外部验证队列来自中国南昌大学第一附属医院等机构的255例患者。

关键发现:

XGBoost模型表现最优,训练集AUC达0.988,验证集保持0.866。SHAP分析显示:

  • 肿瘤≥2cm使转移风险激增(SHAP值最高)

  • 接受放疗的患者风险降低40%

  • 甲状腺全切术比部分切除预后更好

    有趣的是,家庭收入与种族也进入前五预测因子,提示社会经济因素可能影响诊疗质量。模型对T3-4期患者的预测灵敏度达96.7%,但对微小癌(<1cm)存在3.2%假阴性。

临床应用:

研究团队开发了可视化在线计算器(http://127.0.0.1:3384),临床医生输入9项参数即可获得转移风险值。例如:

  • 输入参数:肿瘤3cm(T2)、放疗(是)、全切手术→风险值8.5%

  • 相同参数但未放疗→风险值跃升至23.7%

讨论与展望:

相比既往研究(如Mourad等仅关注生存率),本模型首次实现双转移灶同步预测,且创新应用SHAP提升可解释性。局限性在于SEER数据库缺乏分子标志物记录,未来可整合BRAFV600E等基因数据优化模型。值得注意的是,中国验证队列的转移率(12.55%)显著高于SEER数据,提示地域差异可能影响模型校准。

结论:

该研究建立的智能预测系统突破了传统AJCC分期的局限,首次实现了个体化转移风险评估。特别是发现肿瘤≥2cm的明确阈值效应,为临床制定干预临界点提供了循证依据。模型已具备临床转化条件,后续可通过前瞻性研究验证其对治疗决策的指导价值。

生物通微信公众号
微信
新浪微博


生物通 版权所有