编辑推荐:
摘要本文采用时间分层的方法对乳腺癌患者的生存情况进行分析,同时考虑了肿瘤特征、疾病阶段和患者个体特征,并利用机器学习(ML)算法来支持个性化护理计划的制定。鉴于输入数据与死亡风险之间存在非线性关系,以及患者特征随时间的变化,我们使用了6种ML算法(包括XGBoost、逻辑回归、随
本文采用时间分层的方法对乳腺癌患者的生存情况进行分析,同时考虑了肿瘤特征、疾病阶段和患者个体特征,并利用机器学习(ML)算法来支持个性化护理计划的制定。鉴于输入数据与死亡风险之间存在非线性关系,以及患者特征随时间的变化,我们使用了6种ML算法(包括XGBoost、逻辑回归、随机森林、决策树、AdaBoost和多层感知器)来预测患者6个月以内、6个月、1年、2年、3年、5年和10年的生存率。研究数据来自3,476名乳腺癌患者,共包含43个特征变量。其中,XGBoost的表现最为出色,准确率超过了90%。通过Shapley Additive Explanations(SHAP)方法分析得出,影响生存率的主要因素包括:DCIS(导管原位癌)程度、Ki-67指数、年龄、哺乳情况、淋巴结分级等。具体而言,较低的DCIS和Ki-67值、较低的淋巴结及肿瘤分级、较少的前哨淋巴结受累、较高的年龄、较长的哺乳时长、较小的肿瘤体积、髓样肿瘤类型、PR+和ER+阳性状态、较少的阳性淋巴结、较多的妊娠经历、早期乳腺癌的BCS(保乳手术)类型、较低的肿瘤分期、无坏死现象、HER2阴性、无家族病史以及无钙化灶等因素均与更长的生存时间相关。此外,我们通过5折交叉验证(CV)和嵌套交叉验证(nested CV)方法对模型性能进行了验证,并通过准确率、精确度、F1分数和召回率等指标对模型进行了评估。所有结果表明,所提出的方法具有更好的性能。本文从临床、分子和人口统计学角度对生存分析进行了深入探讨,同时利用可解释的ML技术为个性化治疗决策提供了支持。
本文采用时间分层的方法对乳腺癌患者的生存情况进行分析,同时考虑了肿瘤特征、疾病阶段和患者个体特征,并利用机器学习(ML)算法来支持个性化护理计划的制定。鉴于输入数据与死亡风险之间存在非线性关系,以及患者特征随时间的变化,我们使用了6种ML算法(包括XGBoost、逻辑回归、随机森林、决策树、AdaBoost和多层感知器)来预测患者6个月以内、6个月、1年、2年、3年、5年和10年的生存率。研究数据来自3,476名乳腺癌患者,共包含43个特征变量。其中,XGBoost的表现最为出色,准确率超过了90%。通过Shapley Additive Explanations(SHAP)方法分析得出,影响生存率的主要因素包括:DCIS(导管原位癌)程度、Ki-67指数、年龄、哺乳情况、淋巴结分级等。具体而言,较低的DCIS和Ki-67值、较低的淋巴结及肿瘤分级、较少的前哨淋巴结受累、较高的年龄、较长的哺乳时长、较小的肿瘤体积、髓样肿瘤类型、PR+和ER+阳性状态、较少的阳性淋巴结、较多的妊娠经历、早期乳腺癌的BCS(保乳手术)类型、较低的肿瘤分期、无坏死现象、HER2阴性、无家族病史以及无钙化灶等因素均与更长的生存时间相关。此外,我们通过5折交叉验证(CV)和嵌套交叉验证(nested CV)方法对模型性能进行了验证,并通过准确率、精确度、F1分数和召回率等指标对模型进行了评估。所有结果表明,所提出的方法具有更好的性能。本文从临床、分子和人口统计学角度对生存分析进行了深入探讨,同时利用可解释的ML技术为个性化治疗决策提供了支持。
生物通 版权所有