甲状腺超声(Ultrasound, US)是评估甲状腺结节的首选工具,但良恶性结节的超声征象存在重叠,且操作者经验与诊断标准差异导致观察者间一致性低,单纯US诊断甲状腺癌的灵敏度仅约27%~63%。临床常规推荐甲状腺影像报告和数据系统(Thyroid Imaging Reporting and Data System, TIRADS)≥3级的结节行细针穿刺活检(Fine-Needle Aspiration Biopsy, FNAB),但FNAB存在约20%的不明诊断率或需重复操作。传统计算机辅助诊断依赖手工提取特征,而现有深度学习(Deep Learning, DL)方法多需精细的图像级标注(耗时费力),或以TIRADS为标签间接训练,未能直接预测组织学结果。此外,单次超声检查产生多帧动态图像,单张图像诊断会丢失整体信息。因此,研究人员拟开发一种临床实用的诊断模型——ThyUS2Path,采用弱监督的多示例学习(Multiple Instance Learning, MIL)策略,直接利用患者级病理标签从同一患者的多张US图像中学习,实现无创预测甲状腺结节的良性或恶性组织学诊断,无需逐张图像标注。
二、关键技术方法
研究人员收集嘉兴市第二医院两个回顾性数据集:Batch 1含603例患者6014张甲状腺US图像(按患者9:1分为训练-验证与内部测试,并行五折交叉验证);Batch 2含108例患者1978张图像作为外部独立验证集。患者级标签依据最严重组织学诊断(任一枚结节恶性则判为恶性)。构建ThyUS2Path模型:以在ImageNet预训练的ResNet-34为骨干网络(Backbone Network)移除末层全连接层提取特征;设计双重注意力(Dual-Attention)模块——空间注意力模块(Intra-image Region Attention Module, IRAM)捕获单幅图像内区域间依赖关系,实例注意力模块(Inter-image Sample Attention Module, ISAM)通过门控注意力机制为同一患者不同图像分配权重并聚合为患者级特征表示;最终通过全连接层进行二分类(良性/恶性),采用交叉熵损失函数,SGD优化器训练100个Epoch,以验证集AUROC选择最佳模型。对比基线为Meanpool与Maxpool MIL方法。性能评估指标为患者水平受试者工作特征曲线下面积(Area Under the ROC Curve, AUROC)及精确召回曲线下面积(Area Under the Precision-Recall Curve, AUPRC)。