背景:甲状腺乳头状癌(papillary thyroid carcinoma, PTC)是全球发病率增长最快的恶性肿瘤之一,占甲状腺癌的80%以上,其中30%~80%的患者会发生颈部淋巴结转移(cervical lymph node metastasis, CLNM),该事件是局部复发、远处转移及生存率降低的重要危险因素。目前术前常规采用超声检查(ultrasound, US)评估颈部淋巴结状态,但其灵敏度仅为26%~47%,难以满足精准诊疗需求。传统影像组学依赖人工标注特征,存在任务适配性差、主观偏差大等局限,而深度学习影像组学(deep learning radiomics, DLR)可通过端到端学习自动提取多层次图像表征,结合临床参数的联合模型有望进一步提升预测效能。目的:本研究旨在构建并验证一种融合DLR特征与临床因素的联合模型,用于PTC患者术前CLNM状态的精准预测,为手术决策提供依据,减少过度治疗。方法:回顾性纳入2015年1月至2020年4月江苏大学附属人民医院经病理确诊的205例PTC患者,按7:3随机分为训练队列(n=143)与验证队列(n=62)。提取术前超声图像的DLR特征,筛选临床相关参数,分别构建DLR模型、临床模型及临床-深度学习联合模型(Cli-DLR)。采用受试者工作特征(receiver operating characteristic, ROC)曲线下面积(area under the curve, AUC)、精确率-召回率曲线、校准曲线等指标评估模型性能,并与高年资放射科医师的诊断结果进行比较。结果:验证队列中,Cli-DLR模型表现最优,AUC达0.80,优于单纯DLR模型(AUC=0.78)与临床模型(AUC=0.66),且在精确率-召回率平衡、校准一致性方面均表现良好。该模型的诊断效能显著优于具有15年以上经验的甲状腺超声放射科医师(AUC=0.568)。结论:Cli-DLR模型可有效预测PTC患者术前CLNM状态,兼具良好的灵敏度与特异度,为临床提供了一种潜在的无创性辅助决策工具,有助于实现个体化手术方案制定,避免不必要的颈部淋巴结清扫。未来需通过前瞻性多中心研究进一步验证其临床应用价值。
论文解读:《基于超声深度学习特征的甲状腺乳头状癌颈部淋巴结转移预测模型研究》
研究背景与意义
甲状腺乳头状癌(papillary thyroid carcinoma, PTC)是当前全球范围内发病率上升最快的实体恶性肿瘤之一,占所有甲状腺癌病例的80%以上。临床数据显示,约30%至80%的PTC患者在病程中会出现颈部淋巴结转移(cervical lymph node metastasis, CLNM),该事件是肿瘤局部复发、远处转移及患者总体生存率下降的核心危险因素。因此,术前精准评估CLNM状态对制定手术方案、判断预后至关重要。目前,超声检查(ultrasound, US)是术前评估颈部淋巴结的首选影像学手段,但其检测CLNM的灵敏度仅为26%~47%,且受操作者经验、患者体型等因素限制,难以满足精准诊疗需求。传统影像组学依赖人工设计与标注图像特征,存在主观偏差大、任务适配性弱等局限。相比之下,深度学习影像组学(deep learning radiomics, DLR)可通过端到端学习自动提取多层次、高维度的图像表征,为提升预测效能提供了新思路。在此背景下,本研究旨在构建并验证一种融合DLR特征与临床因素的联合预测模型,以优化PTC患者术前CLNM评估,减少不必要的颈部淋巴结清扫,避免过度治疗相关并发症。
该研究发表于《Frontiers in Oncology》。
关键技术方法
研究人员回顾性纳入2015年1月至2020年4月江苏大学附属人民医院经手术病理确诊的205例PTC患者,排除图像质量不合格、临床资料缺失等病例后,按7:3比例随机分为训练队列(n=143)与验证队列(n=62)。所有患者术前均接受标准化甲状腺超声检查,由两名具有15年以上经验的放射科医师独立阅片并标注感兴趣区(region of interest, ROI)。采用ResNet50网络迁移学习提取超声图像的2048维DLR特征,经组内相关系数(intraclass correlation coefficient, ICC)筛选稳定性特征(ICC≥0.75)。同时收集年龄、肿瘤大小、超声征象等临床参数,通过递归特征消除法(recursive feature elimination, RFE)结合15折交叉验证分别筛选DLR特征与临床特征,最终构建三类预测模型:仅基于DLR特征的DLR模型、仅基于临床参数的临床模型,以及融合两类特征的临床-深度学习联合模型(Cli-DLR模型)。采用支持向量机(support vector machine, SVM)、逻辑回归(logistic regression, LR)、随机森林(random forest, RF)三种分类器分别建模,以ROC曲线下面积(area under the curve, AUC)、精确率、召回率、校准曲线等为指标评估模型性能,并与高年资放射科医师的诊断结果进行比较。
研究结果
临床特征分析
205例PTC患者中,无CLNM者107例,有CLNM者98例。两组患者在年龄、肿瘤大小、超声征象(包括包膜侵犯、纵横比、内部回声、血流分布等)及术后病理特征(如包膜侵犯)方面存在显著差异(P<0.05),而性别、肿瘤位置等无统计学差异。
模型诊断效能比较
在验证队列中,三类模型的效能呈现梯度差异:临床模型以RF分类器表现最优,AUC为0.66;DLR模型以SVM分类器表现最优,AUC为0.78;Cli-DLR模型以LR分类器表现最优,AUC达0.80。DeLong检验显示,Cli-DLR模型的AUC显著高于临床模型(P=0.00),但与单纯DLR模型的差异无统计学意义(P=0.64)。精确率-召回率曲线显示,Cli-DLR模型的LR分类器平均精确率达0.71,F1分数为0.68,实现了精确率与召回率的良好平衡。校准曲线显示,该模型的预测概率与实际发生风险具有良好的一致性。决策曲线分析表明,在阈值概率为0.05~0.65的临床适用范围内,Cli-DLR模型较“全部治疗”或“全部不治疗”策略能提供更高的净获益,具有实际临床应用价值。
与放射科医师诊断效能的比较
研究中一名具有15年以上甲状腺超声诊断经验的放射科医师对验证队列患者的超声图像进行CLNM诊断,其AUC仅为0.568,灵敏度为0.500,特异度为0.636,均显著低于Cli-DLR模型的效能。
讨论与结论
讨论部分指出,本研究构建的Cli-DLR模型(AUC=0.80)在预测PTC患者术前CLNM状态方面显著优于单纯临床模型(AUC=0.66),也优于研究人员此前基于传统手工影像组学构建的模型(AUC=0.71),验证了DLR特征在挖掘图像深层信息方面的优势。与高年资放射科医师相比,该模型不受主观经验限制,可提供更稳定、客观的辅助诊断依据。决策曲线分析结果进一步证实了其临床实用性,可在阈值概率0.05~0.65范围内为临床决策提供净获益,有助于识别真正需要行预防性颈部淋巴结清扫的高危患者,同时避免低危患者接受不必要的手术及相关并发症(如喉返神经损伤、甲状旁腺功能减退)。
研究同时指出局限性:单中心回顾性设计可能导致选择偏倚,样本量相对较小;超声设备来自不同厂商,图像异质性可能影响特征稳定性。未来需通过多中心前瞻性研究、标准化成像协议及半自动分割技术进一步验证模型的泛化能力。
结论部分明确:研究人员成功构建了可术前无创预测PTC患者颈部淋巴结状态的Cli-DLR模型,其诊断效能优于放射科医师及单纯临床模型,兼具良好的灵敏度与特异度,可为临床个体化手术决策提供重要支持。后续需通过前瞻性多中心研究获取更高级别的临床证据,推动其临床转化应用。