基于常规实验室数据的急性白血病亚型AI预测模型：国际验证与优化研究

时间：2026年3月21日

来源：Nature Communications

编辑推荐：

为解决急性白血病诊疗中的健康不平等问题，特别是资源有限地区难以获取流式细胞术、分子遗传学检测等专业诊断技术，研究人员开展了一项大规模的、国际多中心研究，以验证和优化一种利用常规实验室参数（CBC、PT、Fibrinogen、LDH等）预测急性髓系白血病（AML）、急性早幼粒细胞白血病（APL）和急性淋巴细胞白血病（ALL）亚型的AI模型。结果显示，经孤立森林和局部离群因子集成等优化后，该模型在广泛人群中展现出稳健的预测性能（例如，优化后成人AML的AUROC从0.72提升至0.84），并重新针对儿科患者进行了训练，显著提高了儿童ALL的预测准确性（AUROC达0.95）。该研究表明，基于普及性常规数据的AI工具有潜力弥补诊断鸿沟，支持早期分诊和转诊，推动肿瘤诊疗的公平可及。

尽管在过去几十年里，急性髓系白血病（AML）和急性淋巴细胞白血病（ALL）的治疗水平因靶向药物、基因风险分层细化及早期死亡率降低而有了显著提升，但公平诊断与治疗的可及性问题依然严峻，并阻碍了这些进步惠及更广泛的患者。这一问题在低、中收入国家尤为突出，因为流式细胞术、分子遗传学检测等专业诊断手段的可及性有限，可能导致诊断延误。对于急性早幼粒细胞白血病（APL）这类预后良好但早期死亡率可高达30%的疾病，及时的诊断更是生死攸关。人工智能（AI）展现出助力诊断的巨大潜力，以往研究多聚焦于需要复杂设备（如数字显微镜）的骨髓形态学图像分析。然而，如果有一种工具能仅凭医院普遍开展的常规实验室检查结果，就能快速、低成本地预测白血病亚型，无疑将能为缩小健康差距、加速患者获得适当治疗开辟一条新路。

近期，一项发表在国际顶级期刊《自然·通讯》（Nature Communications）上的研究，正是对这一设想的深入探索与实践。一个国际研究团队在全球范围内集结了来自5大洲、16个国家、20个中心的6206名白血病患者数据，对一个已发表的、基于常规实验室数据的机器学习（ML）模型进行了独立、大规模的测试与系统性优化，旨在评估其在真实世界中的准确性、普适性与临床应用价值，并针对模型暴露的不足进行改进，使其更贴合多元化的临床场景。

为了开展这项研究，作者们主要运用了以下几个关键技术方法：首先，回顾性构建了一个大规模、多样化的国际患者队列，数据来源于多个中心的电子健康记录，涵盖了成人及儿童患者，并特别纳入了不同收入水平国家的数据。其次，研究核心是对一个预先训练好的XGBoost（极端梯度提升）模型进行独立验证，该模型利用血常规、凝血功能、乳酸脱氢酶等常规实验室参数预测AML、ALL和APL。模型性能通过受试者工作特征曲线下面积（AUROC）、敏感性、特异性等指标进行评估。第三，针对模型在多样本中心表现不稳定的问题，研究者开发并应用了一个预处理流程，其核心是结合孤立森林和局部离群因子算法构建的分布离群值检测模型，以筛除可能导致错误预测的数据点，提升模型的稳健性。最后，针对儿童患者实验室特征与成人的差异，研究团队利用儿科队列数据对原模型进行了重新训练。

研究结果

在多样化队列中测试：对AML的预测高度准确，但并非适用于所有患者

研究建立了一个包含6206名患者的全球队列。在成人患者中，直接应用预训练模型（不设置信度阈值）得到的2000次自助法AUROC为：AML 0.82，APL 0.92，ALL 0.79。然而，若采用文献中报告的置信度阈值，虽然能在部分中心达到极高的AUROC（AML和APL可达1.0），但这一严格阈值会将70.8%至92.5%的成人患者排除在预测之外，临床实用性受限。模型在不同地理区域的中心间表现存在显著差异，提示其普适性有待提高。

急性白血病亚型间的特征分布差异：凝血参数和MCV对模型最为重要

通过可解释性分析（SHAP值），研究者揭示了不同白血病亚型的关键判别特征。对于AML，单核细胞计数和百分比是最强的正向预测因子；对于ALL，单核细胞百分比和凝血酶原时间（PT）百分比是强负向预测因子；而低纤维蛋白原水平和低平均血红蛋白浓度（MCHC）则支持APL的预测。这些发现与临床认知相符，增强了模型的可信度。

优化成人患者的算法预测以提高普适性

为解决模型普适性不足的问题，研究者引入了基于孤立森林和局部离群因子的离群值检测流程。该流程以高置信度（>0.9）的预测样本作为训练集，用于识别并筛除在特征分布上偏离主体、可能导致错误预测的样本。在测试集上，这一方法显著提升了所有白血病亚型的预测性能，例如，将成人AML的AUROC从0.72提高至0.84，同时仅排除了12.1%的患者，在准确性和覆盖率之间取得了更好平衡。

针对儿科数据重新训练模型显著提升精度

预训练模型（基于成人数据开发）在儿科患者中表现不佳，特别是对于ALL，AUROC仅为0.75。分析发现，儿科患者与成人在实验室特征（如LDH、纤维蛋白原水平）上存在显著差异。为此，研究团队利用儿科队列数据重新训练了XGBoost模型。重新训练后，模型性能大幅改善，儿童ALL的AUROC达到了0.95，证明了针对特定人群调整模型的必要性。

研究结论与意义

本研究通过大规模国际验证，证实了基于常规实验室数据的AI模型在辅助急性白血病亚型快速鉴别中的可行性与价值，同时也揭示了其在面对全球多样化数据时面临的普适性挑战。研究者通过创新的离群值检测流程有效提升了模型的稳健性和准确性，并通过针对儿科数据的重新训练解决了跨年龄组应用的关键问题。这项工作的重要意义在于，它没有追求在高端、昂贵设备上实现极致精度，而是选择了一条更具包容性的技术路径：利用全球医疗机构最普遍、最易获得的常规检验数据，构建诊断支持工具。这使其在资源有限的环境中尤其具有应用潜力，有望成为缩短诊断时间、促进患者向专科中心及时转诊的“桥梁”，为应对肿瘤诊疗中的健康不平等问题提供了一个切实可行的AI解决方案。当然，该算法并非旨在取代白血病诊断的“金标准”（形态学、流式细胞术、遗传学检测），而是作为初始筛查和分诊的有力补充。研究也指出，在低收入地区，将凝血功能等关键指标纳入白血病患者的常规检查，对于该算法乃至APL的早期识别都至关重要。未来，需要前瞻性临床试验来验证此类AI工具能否真正降低急性白血病，特别是APL在真实世界中的早期死亡率。本研究扎实的验证与优化工作，为后续的临床转化试验铺平了道路。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部