通过可解释的人工智能算法,探讨乳腺癌患者在接受综合治疗后的骨质疏松风险

时间:2026年5月27日
来源:Surgical Oncology

编辑推荐:

张淼淼|陈德波|杨书琪|谢俊杰|李晓明|沙玉鹏|于浩|林张典|尤文康|黄泽辉|洪志鹏|叶荣杰|袁全|曾荣东福建医科大学附属泉州第一医院,中国福建泉州摘要背景骨质疏松症是长期乳腺癌(BC)幸存者中常见的并发症。在治疗前评估患者的骨质疏松风险对于及时干预和长期健康管理至关重要。方法我

广告
   X   

张淼淼|陈德波|杨书琪|谢俊杰|李晓明|沙玉鹏|于浩|林张典|尤文康|黄泽辉|洪志鹏|叶荣杰|袁全|曾荣东
福建医科大学附属泉州第一医院,中国福建泉州

摘要

背景

骨质疏松症是长期乳腺癌(BC)幸存者中常见的并发症。在治疗前评估患者的骨质疏松风险对于及时干预和长期健康管理至关重要。

方法

我们纳入了2018年至2022年间在中国一家三级医院接受治疗的女性乳腺癌患者。收集了基线特征、血液学参数和病理亚型,并根据激素受体和HER2状态将其分为四组。开发了十二种机器学习(ML)算法,使用SHAP分析解释了表现最佳的模型。

结果

在1,314名患者中,546名(41.6%)被诊断为骨质疏松症,主要发生在HR阳性亚型中。随机森林在HR-/HER2-患者中表现最佳(验证AUC = 0.773),血小板计数、LDH、年龄、γ-GTP、尿酸和球蛋白是关键预测因子。在HR-/HER2+患者中,梯度提升算法表现最佳(AUC = 0.942),血液学和代谢标志物是主要贡献因素。对于HR+/HER2-和HR+/HER2+组,提升模型的AUC分别为0.832和0.771,淋巴结分期、年龄、血小板计数、尿酸和肝/肾指标是主要预测因子。SHAP依赖图揭示了关键交互作用,例如年龄与血小板计数以及淋巴结分期与胆红素的交互作用。

结论

乳腺癌的分子亚型之间的骨质疏松风险差异显著,受临床和生化因素共同影响。结合可解释性AI的机器学习能够提供准确的预测,并突出关键风险决定因素,为乳腺癌幸存者的个性化骨骼健康管理提供潜在工具。

引言

乳腺癌(BC)是全球最常见的恶性肿瘤,尤其常见于绝经后妇女[1]。早期筛查项目的广泛实施和治疗方法的不断增加,导致长期幸存者人数不断增加[2, 3]。因此,乳腺癌患者的治疗后健康问题越来越受到临床医生的关注。大量研究表明,相当比例的乳腺癌患者存在骨代谢紊乱,包括骨量减少和骨形成与吸收失衡[4]。这些紊乱使个体容易发生骨质流失,最终可能导致骨质疏松症。此外,芳香化酶抑制剂(AIs)的使用或化疗引起的早绝经会导致乳腺癌患者雌激素水平异常,这是骨质疏松风险增加的关键因素[5, 6, 7]。其他促成因素还包括维生素D缺乏和不良生活方式选择,如吸烟和过量饮酒,这些都会增加乳腺癌相关骨质疏松(BCAO)的风险[8]。BCAO给患者带来巨大的心理和身体负担[8]。此外,治疗和骨质疏松性骨折管理的巨额费用进一步加剧了社会经济压力[9]。因此,早期识别高风险的BCAO患者,并实施抗骨质疏松干预或预防性健康教育,对于提高乳腺癌幸存者的长期生活质量和社会福祉至关重要。机器学习(ML)作为人工智能的一个重要分支,在从高维数据中识别关键特征方面表现出色,并已广泛应用于疾病早期诊断和预后预测[10, 11, 12]。其在基于病史、遗传信息和其他相关因素的疾病风险分层中尤其有用[3, 13]。然而,许多ML算法固有的“黑箱”性质给其临床转化和应用带来了挑战[14]。基于博弈论的Shapley Additive exPlanations(SHAP)提供了一个强大的框架,可以量化每个特征变量对模型预测输出的贡献,从而提高模型的透明度和临床可解释性[15, 16]。
常用的风险评估工具,如亚洲人骨质疏松自我评估工具(OSTA),主要根据体重和年龄对个体进行分层,没有充分考虑血液常规检查、生化检查和癌症治疗方案等临床指标,这可能会影响其预测准确性。此外,以往的研究主要集中在一般人群的风险预测上,不同分子亚型的风险分层模式研究不足。本研究旨在利用可获得的基线临床信息、实验室检查和病理特征,为四种乳腺癌亚型开发一个治疗后的骨质疏松风险预测模型。这将通过应用先进的机器学习技术和SHAP分析来实现。我们希望开发的临床预测工具能够帮助医生评估治疗后的骨质疏松风险,为乳腺癌患者的骨骼健康管理提供有价值的指导。

章节片段

研究人群

这项回顾性队列研究纳入了2018年至2022年间在中国一家三级甲等医院乳腺外科新诊断并接受治疗的1428名乳腺癌患者,随访截至2025年8月。排除临床数据不足、随访丢失或拒绝随访、长期使用糖皮质激素治疗以及之前接受过抗骨质疏松治疗的患者后,最终共有1314名患者纳入分析。所有患者都接受了

基线特征

研究设计如图1所示。共有1314名患者参与了这项研究(表1)。Lasso回归分析确定了20个与骨质疏松发展相关的因素,包括年龄、BMI、白蛋白、肌酐、直接胆红素、血红蛋白、INR、K、LDH、淋巴细胞、M、N、PHOS、血小板、PT、红细胞、尿素氮、尿酸、白细胞和γ-GTP。患者随后根据病理结果分为四组:HR-/HER2- 、HR-HER+

讨论

在这项研究中,我们尝试开发基于ML的模型来预测不同分子亚型乳腺癌患者的骨质疏松风险:HR-HER2-、HR-HER2+、HR+HER2-和HR+/HER2+。通过整合易于获取的人口统计学、临床病理学和血液学参数,并结合SHAP进行可解释性人工智能分析,我们描述了不同乳腺癌亚型中异质性的骨质疏松风险特征及其潜在的风险分层模式。
作为最

结论

我们探讨了影响四种乳腺癌亚型患者骨质疏松风险的关键因素,并使用可解释性人工智能阐明了重要变量对每个模型结果的影响。我们开发的临床工具可以帮助临床医生进行长期健康管理和治疗指导。

CRediT作者贡献声明

谢俊杰:数据整理、调查、方法学、验证、写作——审阅与编辑。杨书琪:数据整理、正式分析、方法学、软件、验证、写作——初稿、审阅与编辑。沙玉鹏:正式分析、调查、方法学、验证、写作——审阅与编辑。李晓明:正式分析、方法学、软件、可视化、写作——审阅与编辑。林张典:数据整理、方法学、可视化、写作——审阅与

数据可用性

本研究使用的数据集可向相应作者提出合理请求后获取。

人类伦理和参与声明

本研究获得了泉州第一医院伦理委员会的批准(伦理编号:2025K273),并在国家健康信息平台上注册。研究严格遵循赫尔辛基宣言的伦理原则,所有数据均已匿名处理。由于研究的回顾性质,无需获得知情同意。

资金

不适用。

利益冲突声明

作者声明没有利益冲突。

生物通微信公众号
微信
新浪微博


生物通 版权所有