评估不同筛查系统下乳腺癌风险预测模型在英国国家筛查项目中的表现

时间：2026年3月9日

来源：npj Digital Medicine

编辑推荐：

本研究探讨了如何利用AI预测“阴性”乳腺X光片背后的短期患癌风险。研究人员回顾性评估了四种深度学习算法（Mirai, iCAD, Transpara, Google）在英国两大筛查中心、使用不同设备（Philips, GE）获取的超过11万张阴性乳腺X光片中的表现。结果显示，算法能有效区分未来患癌风险（AUC最高达0.72），其中高风险组可识别出约20%的未来癌症，包括27%的“间期癌”。这为通过风险分层优化筛查策略提供了重要证据。

乳房X线摄影筛查是降低乳腺癌死亡率的关键公共卫生措施，但这一体系并非完美无缺。有一种令人担忧的癌症类型，它们狡猾地潜伏在两次常规筛查的间隙，在所谓的“阴性”筛查结果后被诊断出来，这就是“间期癌”。数据显示，高达30%的间期癌比筛查发现的癌症预后更差，这暴露出现有筛查模式存在“漏网之鱼”的短板。能否在看似正常的筛查影像中，提前嗅到癌症的风险气息，从而实现更精准、更个体化的筛查管理？这正是人工智能与医学影像结合的前沿战场。

深度学习算法已展现出从“阴性”乳腺X光片中估算短期乳腺癌风险的潜力，有望指导补充影像检查或调整筛查间隔。然而，一个核心的临床转化难题在于：这些在特定数据集上表现优异的算法，在面对不同医院、不同品牌设备采集的真实世界、大规模国家筛查数据时，其表现是否依然稳健可靠？此前，缺乏基于完整国家筛查项目数据的比较性验证。为了回答这个问题，一项大规模回顾性研究得以开展，其成果发表于《npj Digital Medicine》期刊。

研究人员为验证算法的泛化能力，设计了一项严谨的回顾性队列研究。他们从英国国家健康服务体系（NHS）的两个乳腺癌筛查中心，收集了在2014年至2017年一个筛查周期内的112,621张被初始判读为“阴性”的乳腺X光片，并进行了长达五年的随访，共观察到1225例未来发生的乳腺癌。这些影像数据来源于两种主流的不同品牌全视野数字乳腺X线摄影（FFDM）系统：飞利浦（Philips）和通用电气（GE）。研究团队利用这个宝贵的真实世界数据集，对四种前沿的乳腺癌风险预测深度学习算法——Mirai、iCAD、Transpara和Google进行了头对头的性能评估与比较。核心评估指标包括区分未来患癌风险的能力（用曲线下面积AUC衡量）以及在高风险阈值下识别未来癌症（特别是间期癌）的效能。

算法判别性能存在显著差异

研究首先评估了四种算法在预测未来罹患乳腺癌（所有类型）风险上的整体判别能力。结果表明，算法间存在明显的性能排名。在包含所有未来癌症的测试中，整体AUC（Area Under the Curve，曲线下面积）范围在0.65至0.72之间。值得注意的是，当进一步聚焦于那些更具临床挑战性的间期癌时，算法的AUC值范围提升至0.67至0.77，显示出对这类高恶性度癌症更强的识别潜力。一个关键发现是，在两种不同的乳腺X光摄影系统（Philips vs. GE）之间，仅有一种算法的性能表现出统计学上的显著差异，这提示大部分顶级算法对不同影像采集设备具有一定的鲁棒性，但系统特异性差异仍需关注。

高风险分层可识别大量未来癌症

研究的另一核心是评估算法通过风险分层来识别高危人群的效能。分析显示，当将风险评分最高的4.0%个体定义为高风险人群时，表现最优的算法能够从所有初始阴性的筛查人群中，识别出约20%的未来五年内将发生的乳腺癌。更令人印象深刻的是，对于预后较差的间期癌，同一风险阈值下的识别率高达约27%。当将高风险阈值放宽至风险评分最高的14.0%时，识别出的未来癌症比例实现翻倍。这强有力地证明，即使基于单次“阴性”筛查的影像，AI风险预测模型也能成功分离出一小部分高危人群，其中包含了相当大比例的未来癌症患者。

研究意义与未来方向

这项研究首次在英国国家乳腺癌筛查项目的真实世界、多中心、多设备环境下，对多种主流深度学习风险预测算法进行了大规模的比较验证。其结果证实，基于乳腺X光片的AI风险模型具有区分未来乳腺癌风险的可靠能力，且部分优秀算法在不同影像设备间展现出良好的泛化性。通过风险分层，AI能够从海量“阴性”筛查中精准定位出包含大量间期癌在内的高危人群，这为变革“一刀切”的筛查模式提供了实证依据。未来，可以设想对筛查间隔或补充影像检查（如乳腺超声或磁共振）的建议进行个性化调整，对高风险女性加强监测，而对低风险女性则可能适当延长筛查间隔，从而在平衡收益与风险的同时优化医疗资源分配。

然而，研究也揭示了算法性能的差异以及潜在的系统依赖性，强调了在临床部署前进行多算法前瞻性试验的必要性。此外，针对未见过的影像系统进行算法微调，可能是进一步提升其普遍适用性的关键。总之，这项工作标志着AI驱动精准乳腺癌筛查向临床现实迈出了坚实一步，其发现将为设计更智能、更高效的下一代癌症筛查策略奠定坚实基础。