基于人工智能的非增强CT大规模胃癌筛查系统GRAPE的开发与验证

时间:2025年6月25日
来源:Nature Medicine

编辑推荐:

本研究针对胃癌(GC)筛查中内镜检查资源有限、依从性低的问题,开发了基于深度学习的人工智能系统GRAPE,通过分析常规非增强CT图像实现胃癌的早期检测。研究在包含3,470例GC和3,250例非GC病例的训练队列中开发模型,在18,160例多中心外部验证中达到AUC 0.927,显著优于放射科医生诊断性能。真实世界研究显示,GRAPE在78,593例连续CT扫描中成功识别出早期胃癌病例,为大规模胃癌筛查提供了高效、经济的解决方案。

广告
   X   

胃癌是全球第五大常见癌症和第四大癌症相关死亡原因,尤其在亚洲国家负担沉重。虽然内镜检查是胃癌诊断的金标准,但其高昂成本、侵入性和低依从性限制了大规模筛查的可行性。日本和韩国通过国家筛查计划将早期诊断率提升至60%以上,而中国仅为35.9%,凸显了开发替代筛查方法的紧迫性。现有血清学检测方法对胃癌的检出率仅1.25%,与普通人群内镜筛查相当,无法满足临床需求。非增强CT作为一种广泛使用、低成本的影像学检查,为大规模胃癌筛查提供了潜在机会,但由于胃部充盈状态和蠕动等因素影响,传统CT在胃癌检测中的价值尚未充分发掘。

为解决这一临床难题,浙江省肿瘤医院等机构的研究人员开发了基于人工智能的胃癌风险评估系统GRAPE。这项发表在《Nature Medicine》的研究通过三个阶段系统评估了GRAPE在胃癌筛查中的应用价值:模型开发与验证、与放射科医生诊断性能比较、真实世界临床应用评估。研究团队首先利用来自2个中心的3,470例胃癌和3,250例非胃癌病例开发模型,采用深度学习框架分析三维非增强CT图像,通过两阶段策略实现胃部分割和肿瘤检测。技术方法上,研究采用nnUNet架构进行胃部分割和肿瘤检测,通过五折交叉验证优化模型性能,并利用Grad-CAM技术增强模型可解释性。外部验证队列来自16个中心的18,160例病例,真实世界评估则分析了78,593例连续非增强CT扫描。

研究结果显示,GRAPE在内部验证队列中达到AUC 0.970(95%CI 0.962-0.978),敏感性0.851,特异性0.968;在外部多中心验证中保持稳定性能(AUC 0.927)。值得注意的是,GRAPE对T3/T4期胃癌的检出率超过90%,对早期胃癌(T1/T2)的敏感性约为50%。与13位放射科医生相比,GRAPE显著提高了诊断准确性(AUC 0.92 vs 0.76-0.85),尤其在胃中段病变检测中表现突出。真实世界研究中,GRAPE在两所地区医院的高风险人群中分别检出24.5%和17.7%的胃癌病例,其中23.2%和26.8%为T1/T2期早期胃癌。在癌症中心的验证中,GRAPE成功识别出6个月前被放射科医生漏诊的胃癌病例,实现了早期诊断。

模型构建方面,GRAPE采用联合分类和分割网络架构,既保留了局部纹理模式识别能力,又维持了对胃整体形态结构的理解。与传统方法相比,该设计不仅提高了特征学习效率,还通过提供肿瘤分割掩模增强了临床可解释性。研究还发现,胃充盈状态显著影响早期胃癌检出率,良好充盈状态下EGC检出率提高10.72%。

在讨论部分,作者指出GRAPE的性能优于既往基于临床信息和血清学标志物的模型(AUC 0.757-0.79),与液体活检技术(AUC 0.83-0.94)相当。虽然GRAPE不旨在替代内镜检查,但它为犹豫接受初始内镜筛查的有症状患者提供了有价值的替代方案。研究也承认当前局限性,包括需要更大规模前瞻性验证、提高对早期胃癌的敏感性,以及扩展检测其他罕见胃部肿瘤的能力。

这项研究的创新性在于首次证实了常规非增强CT结合深度学习在胃癌筛查中的巨大潜力。GRAPE系统的高敏感性和特异性,以及在实际临床环境中的稳健表现,为资源有限地区开展大规模胃癌筛查提供了可行方案。未来通过纳入更多早期胃癌训练数据、整合内镜和病理报告信息,以及采用测试时自适应技术,有望进一步提升模型性能。该研究成果对降低胃癌死亡率、改善公共卫生具有重要意义,代表了人工智能在癌症筛查领域的重要突破。

生物通微信公众号
微信
新浪微博


生物通 版权所有