编辑推荐:
本研究针对肝细胞癌(HCC)超声筛查中诊断准确率与放射科医生工作负荷的双重挑战,开发了UniMatch病灶检测和LivNet分类的AI系统。通过四类人机交互策略测试,发现策略4(AI初筛+放射科医生复核阴性病例)在保持高灵敏度(0.956)的同时提升特异性(0.787),减少54.5%工作量,降低假阳性率和召回率,为临床实践提供了优化方案。
肝细胞癌(HCC)作为全球第三大癌症死因,早期筛查至关重要。然而传统超声筛查面临双重困境:一方面存在诊断准确性瓶颈,可能遗漏小病灶;另一方面随着筛查普及,放射科医生面临日益沉重的工作负荷。这种矛盾在中国等肝病高发地区尤为突出,如何平衡筛查效率与质量成为临床迫切需求。
中山大学附属第一医院联合国内7家医疗中心的研究团队在《npj Digital Medicine》发表突破性研究,通过开发UniMatch病灶检测和LivNet分类两大AI模型,系统评估了四种人机协作策略在21,934张超声图像中的表现。这项回顾性多中心研究创新性地证明:当采用AI初筛结合放射科医生复核阴性病例的策略时,不仅能维持与传统方法相当的灵敏度(0.956 vs 0.991),还将特异性从0.698提升至0.787,同时减少54.5%的工作量,显著降低假阳性和召回率。
关键技术方法包括:1) 基于17,913张图像的半监督分割模型UniMatch开发;2) 融合ConvNeXt、CSWinTransformer和Hiera架构的LivNet分类系统;3) 创新的两阶段标记清除算法;4) 来自8个中心的11,960例患者数据验证;5) 四种人机交互策略的量化比较。
【模型性能】
UniMatch在测试集展现0.941灵敏度和0.833特异性,AUC达0.887;LivNet在0.2阈值下取得0.891灵敏度和0.783特异性。标记清除处理使模型性能更接近真实临床场景。
【策略比较】
策略4(AI检测+放射科复核)表现最优:保持非劣效灵敏度(0.956)同时实现特异性优势(0.787),工作量减少54.5%,召回率从0.694降至0.636,假阳性率从0.302降至0.213。
【不确定性分析】
策略4的香农熵分析显示,相比纯AI策略能减少诊断错误的过度自信,在确定性决策中错误率仅7.96%,显著低于策略1的10.33%。
【亚组分析】
对<1cm小病灶,策略4灵敏度达0.833,优于其他策略;对≥1cm病灶灵敏度达0.957,验证了模型对不同尺寸病灶的适应性。
这项研究首次系统评估了AI在HCC超声筛查中的整合策略,证实人机协作不仅能提升诊断效能,还可大幅缓解医疗资源压力。策略4通过AI初筛和放射科针对性复核的"双保险"机制,既避免了纯AI系统的漏诊风险,又显著降低不必要召回。特别值得注意的是,该方案对医疗资源相对匮乏地区具有重要价值,其54.5%的工作量降幅意味着可筛查人口的大幅扩展。研究提出的多专家混合融合架构和不确定性量化方法,为医疗AI的可信部署提供了新范式。未来需通过前瞻性研究验证其临床效益,并探索在放射科医生直接操作超声场景下的适用性调整。
生物通 版权所有