一种用于预测甲状腺癌甲状腺外扩展的临床超声放射组学模型的诊断性能和泛化能力:一项回顾性研究

时间:2026年3月31日
来源:Annals of Medicine

编辑推荐:

摘要 背景 超声波在甲状腺癌及其甲状腺外扩展(ETE)的术前评估中起着关键作用。本研究旨在开发并验证一个整合了超声放射组学和临床因素的模型,以预测ETE。 方法 在这项回顾性研究中,我们回顾了南昌大学第一附属医院420名接受甲状腺癌手术患者的资料。根据术后病理结

广告
   X   

摘要
背景
超声波在甲状腺癌及其甲状腺外扩展(ETE)的术前评估中起着关键作用。本研究旨在开发并验证一个整合了超声放射组学和临床因素的模型,以预测ETE。

方法
在这项回顾性研究中,我们回顾了南昌大学第一附属医院420名接受甲状腺癌手术患者的资料。根据术后病理结果,将这些患者分为非ETE组和ETE组,并以7:3的比例随机分配到训练组和内部验证组。外部测试组包括来自复旦大学华山医院的70名患者。从所有肿瘤区域的术前超声图像中提取了放射组学特征。使用最小绝对值收缩选择算子(LASSO)逻辑回归进行特征选择,以构建放射组学特征谱。随后通过结合放射组学评分和临床-超声因素,开发了一个诺模图(nomogram)。使用接收者操作特征曲线(ROC)分析和决策曲线分析(DCA)评估了该模型的预测性能。

结果
组合模型表现出优异的校准和区分能力,在训练组、内部验证组和外部测试组中的曲线下面积(AUC)分别为0.898、0.873和0.857。DCA证实了放射组学诺模图相比仅使用临床-超声因素的模型具有更优越的临床实用性。亚组分析进一步显示,该模型在不同肿瘤大小、ETE程度和桥本氏甲状腺炎状态下的表现均稳健。

结论
基于超声放射组学的诺模图在预测ETE方面表现出良好的性能和高准确性,表明其作为有价值的术前辅助诊断工具的潜力。

关键词:
甲状腺癌;甲状腺外扩展;超声波;放射组学

引言
甲状腺癌是全球第七大常见癌症,其发病率在过去四十年中显著增加[引用1]。乳头状甲状腺癌(PTC)是最常见的组织学类型,约占病例的85%,通常预后良好[引用2, 引用3]。然而,PTC患者的预后会因颈部淋巴结转移、远处转移或甲状腺外扩展(ETE)的存在而显著恶化。因此,ETE被纳入了几种分化型甲状腺癌(DTC)风险分层系统中,如GAMES(性别、年龄、转移、甲状腺外扩展、大小)[引用4]和MACIS(转移、年龄、切除完整性、侵袭、大小)系统[引用5]。值得注意的是,具有ETE的PTC患者的15年生存率明显低于没有ETE的患者[引用6]。目前,活检或手术后的组织病理学检查仍是诊断ETE的金标准[引用7]。包括磁共振成像(MRI)、计算机断层扫描(CT)、单光子发射计算机断层扫描(SPECT)和超声检查(US)在内的多种成像技术被用于ETE的术前评估。其中,US由于其成本效益、非侵入性和无电离辐射的特点,成为PTC患者最常用的成像技术。因此,本研究重点关注基于US的放射组学分析以预测ETE。先前的研究[引用8–11]已经确定了ETE涉及带状肌、气管和喉返神经(RLN)的相应超声特征,为术前诊断提供了重要参考。然而,尽管US的敏感性相对较高(60%-70%[引用12]),但其特异性仍然有限(40%-50%[引用12])。

放射组学涉及从医学图像中高通量提取亚视觉特征,用于定量疾病分析[引用13–16]。它越来越多地应用于肿瘤诊断、预后预测和基因组分析等肿瘤学研究领域。为了识别最具信息量的放射组学特征并构建预测模型,我们采用了最小绝对值收缩选择算子(LASSO)回归方法,该方法通过将不太重要的预测因子的系数缩减至零来选择特征,从而减少过拟合并提高模型的泛化能力。放射组学评分(Rad-score)是通过加权各LASSO系数的选定特征计算得出的线性组合,作为反映个体患者放射组学特征的定量成像生物标志物——Rad-score越高,表示ETE的可能性越大。因此,本研究旨在基于US放射组学开发一个组合模型,以预测PTC的ETE,从而解决传统US评估的局限性,并可能帮助临床医生为PTC患者选择最合适的治疗策略。

材料与方法
研究人群和设计
这项回顾性研究获得了机构审查委员会的批准(批准编号:IIT [2024]-724),并遵循1964年《赫尔辛基宣言》及其后续修订版的原则进行。由于研究的回顾性质,无需获得知情同意。我们回顾性地纳入了2022年1月至2024年12月在南昌大学第一附属医院(机构1)接受治疗的PTC患者。外部验证组包括2023年11月至2024年9月在复旦大学华山医院(机构2)接受治疗的患者。纳入标准如下:(1)接受甲状腺癌全切或部分切除的患者;(2)接受术前甲状腺超声(US)评估的患者。排除标准包括:(1)因复发性甲状腺癌接受手术的患者;(2)手术或病理报告不完整的患者;(3)超声图像质量差的患者,具体包括:图像模糊或分辨率低,难以识别病变边界;存在显著伪影(如声影、混响或气体干扰)遮挡病变关键区域;或灰度对比度不足,难以区分病变与周围组织;(4)有远处转移证据的患者;(5)术前血清学检测结果不完整的患者;(6)临床数据不完整或缺失随访记录的患者。纳入的患者被随机分配到训练集(n=294)和内部测试集(n=126),比例为7:3。还建立了一个由70名患者组成的独立外部验证组。研究流程图见图1。

图1. 患者纳入和排除标准流程图。流程图显示了纳入/排除甲状腺癌患者的标准,以及将患者分为训练组、验证组和外部测试组的标准。ETE:甲状腺外扩展。

收集了以下基线数据和临床指标——所有数据均在术前获得:人口统计特征(年龄、性别);肿瘤临床特征(肿瘤大小、原发位置);以及相关的甲状腺功能指标和抗体水平。年龄和肿瘤直径分别使用≥55岁和≥2厘米的阈值进行二分。这些阈值是根据美国癌症联合委员会(第8版)甲状腺癌TNM分期系统和美国甲状腺协会分化型甲状腺癌管理指南中的关键标准确定的。此外,还分析了术后病理学确认的颈部淋巴结转移状态。具体的甲状腺功能和抗体检测及其参考范围如下:游离三碘甲状腺原氨酸(fT3,参考范围:2.50–3.90 pg/mL)、游离甲状腺素(fT4,参考范围:0.60–1.60 ng/dL)、促甲状腺激素(TSH,参考范围:0.30–5.60 μIU/mL)、抗甲状腺球蛋白抗体(Tg-Ab,参考范围:0.0–60.0 IU/mL)、抗甲状腺过氧化物酶抗体(TPO-Ab,参考范围:0.0–60.0 IU/mL)和血清甲状腺球蛋白(Tg,参考范围:1.40–78 ng/mL)。通过一系列病理切片技术、术后组织病理学检查结果和术中肉眼观察,全面准确地评估了肿瘤的侵袭范围和程度。

根据美国癌症联合委员会(AJCC)第8版分期手册[引用3],侵犯甲状腺周围软组织(包括显微肌肉侵犯)的肿瘤被诊断为轻度甲状腺外扩展(mETE)。肿瘤明显侵犯带状肌或主要颈部结构(皮下软组织、喉部、气管、食管、喉返神经、椎前筋膜或颈动脉/纵隔血管)的被诊断为重度甲状腺外扩展(gETE)。为了本研究的目的,mETE和gETE被统称为ETE进行后续分析。

仪器和检查方案
超声检查使用以下系统进行:Philips EPIQ 7(Philips Healthcare)、Toshiba Aplio 500(Canon Medical Systems)、Mindray Resona 7、Mindray DC-8(深圳迈瑞生物医学电子有限公司)、Siemens ACUSON Sequoia和Supersonic Aixplorer。患者采取仰卧位,颈部完全暴露以便进行术前超声检查。所有超声图像均由具有五年以上甲状腺超声诊断经验的医生采集。

在本研究中,超声特征指的是经验丰富的放射科医生在术前超声图像上评估的具体成像特征,包括定性和定量参数。采集的超声图像用于记录以下特征:肿瘤的最大直径、多灶性、双侧性、结节与甲状腺包膜的接触情况、肿瘤与气管的角度、与气管食管沟的接触情况以及任何超声可疑淋巴结的存在。根据中国甲状腺影像报告和数据系统(C-TIRADS)对发现进行了评估和记录。

放射组学分析
在提取放射组学特征之前,对所有二维超声图像进行了标准化预处理。步骤如下:① 使用线性插值将图像重采样为一致的1.0 mm × 1.0 mm像素间距,以消除分辨率差异。② 使用64个bin的固定箱数方法对每个感兴趣区域(ROI)内的灰度强度进行离散化,以降低对噪声的敏感性。③ 对每个ROI应用轻微的二维高斯滤波器(σ = 0.5 mm)以抑制固有的斑点噪声。④ 对每个ROI内的像素强度应用Z-score标准化(均值 = 0,标准差 = 1),以最小化由于扫描增益设置差异引起的变异。

特征提取
一位具有五年以上甲状腺超声诊断经验的放射科医生使用3D-Slicer软件(版本5.9.0)在肿瘤最大且最清晰的二维(2D)横截面上手动勾画出感兴趣区域(ROI)。ROI紧密沿着肿瘤边界绘制,以包含整个实体肿瘤区域,同时排除囊性改变、粗大钙化和周围正常甲状腺组织。放射组学特征是通过计算机算法提取的高维定量成像生物标志物,能够捕捉人眼无法察觉的组织异质性和纹理信息。在本研究中,使用3D-Slicer平台内置的放射组学模块提取了总共849个放射组学特征。这些特征分为六类:一阶统计量、灰度依赖矩阵(GLDM)、灰度共生矩阵(GLCM)、灰度长度矩阵(GLRLM)、灰度大小区域矩阵(GLSZM)和相邻灰度差异矩阵(NGTDM)。特征既来自原始图像,也来自使用小波滤波器变换后的图像。

使用类内相关系数(ICC)评估特征提取的观察者间和观察者内再现性。为了计算ICC,两周后由同一位放射科医生(读者1)和另一位独立放射科医生(读者2)重新分割了50名患者的随机子集超声图像。最终分析中使用的所有图像的主要分割工作均由读者1完成。

特征选择
为了避免乐观偏差,所有特征选择过程严格限制在训练集(n = 294)内进行,并独立完成。内部验证集和外部测试集未参与任何特征选择或参数调整步骤。特征选择过程如下:首先,基于训练集数据,使用类内相关系数(ICC)评估所有最初提取的放射组学特征的可重复性。仅保留具有高可重复性(ICC ≥ 0.80)的特征进行后续分析。随后,计算训练组内保留特征的皮尔逊相关系数矩阵。识别出高度共线性的特征对(绝对相关系数|r| > 0.7),并随机移除每对特征中的一个,以确保后续建模的特征独立性。最后,在训练集上应用最小绝对值收缩选择算子(LASSO)回归算法进行进一步特征选择。通过十折交叉验证调整了最佳惩罚参数。选择非零系数的特征,这些系数定义为表示每个特征与ETE相关性的权重。然后计算每个患者的放射组学评分(Rad-score),作为选定特征的线性组合,权重由各自的LASSO系数决定。这个Rad-score用于构建最终的放射组学模型。

模型开发和性能评估
开发了三个预测模型:临床模型、放射组学模型和组合模型。在训练集中,单变量逻辑回归分析中显示统计显著性的变量随后被纳入多变量分析,以构建临床模型和组合模型。德隆测试(DeLong test)被用来比较三种模型之间的曲线下面积(AUC)。校准曲线用于评估诺模图(nomogram)的校准性能,而布里尔分数(Brier score)则用于定量评估模型的整体预测准确性。最终确定的模型随后被应用于内部验证和外部测试集,以进行独立的性能评估。模型的区分能力和临床实用性进一步通过接收者操作特征(ROC)曲线分析和决策曲线分析(DCA)进行了分析。

所有统计分析均使用R软件(版本4.4.2;R统计计算基金会)进行。遵循正态分布的连续变量以均值±标准差表示,并使用独立单因素方差分析(one-way ANOVA)进行比较。非正态分布的连续变量以中位数(四分位数范围)表示,并使用克鲁斯卡尔-瓦利斯检验(Kruskal-Wallis test)进行比较。分类数据以频率(百分比)总结,组间比较根据情况使用卡方检验(Chi-square test)或费希尔精确检验(Fisher’s exact test)进行。

多变量逻辑回归分析用于识别临床变量中的独立预测因子,p值<0.05被视为具有统计学意义。亚组间接收者操作特征曲线下面积(AUC)的差异使用汉利-麦克尼尔Z检验(Hanley-McNeil Z-test)进行分析,双侧p值<0.05定义为具有统计学意义。

**临床特征**
训练和内部验证队列(机构1)包括420名甲状腺乳头状癌(PTC)患者,年龄在12至75岁之间(平均年龄45.22±11.30岁),其中83名为男性,337名为女性。其中,263名患者有甲状腺外扩展(ETE)(199名为轻微ETE,64名为重度ETE),而157名患者没有ETE。训练队列包括294名患者(57名为男性,237名为女性),其中187名有ETE,107名没有ETE,平均年龄为45.20±11.50岁。内部验证队列包括126名患者(26名为男性,100名为女性;平均年龄45.25±10.86岁),其中76名有ETE,50名没有ETE。外部测试队列(机构2)包括70名患者,年龄在17至74岁之间(平均年龄43.04±13.78岁),包括19名为男性,51名为女性。在这些患者中,39名有ETE(28名为轻微ETE,11名为重度ETE),31名没有ETE。

患者的基线特征在表1中总结。除了游离甲状腺素(fT4)水平(p=0.024)外,三个队列之间的基线特征没有观察到统计学上的显著差异(所有p>0.05),表明各组的基线数据总体平衡且可比较。尽管fT4水平存在轻微的分布差异,但其幅度较小,表明对后续模型验证和结果稳定性影响有限。

**单变量逻辑回归分析**
单变量逻辑回归分析确定了以下与ETE显著相关的因素(p<0.05):年龄≥55岁、中央淋巴结转移、侧淋巴结转移、双侧肿瘤、肿瘤多灶性、肿瘤直径较大(≥2厘米)、峡部肿瘤、结节与甲状腺包膜的接触、肿瘤-气管角度、与气管食管沟的接触以及C-TIRADS分类4a、4c和5。详细结果见表2。

**特征选择和放射组学特征模型构建**
从预处理图像中,使用3D-Slicer中的PyRadiomics模块提取了总共849个初步的放射组学特征。首先,基于观察者内和观察者间的一致性评估,排除了669个重现性较低的特征(ICC<0.80),保留了180个稳定特征。随后,通过皮尔逊相关系数阈值(|r|≥0.7)消除了冗余特征,得到了16个关键特征。最后,应用最小绝对收缩和选择算子(LASSO)回归,识别出7个系数非零的特征(图2)。然后通过这些选定特征的线性组合构建了放射组学特征模型,并根据相应的系数进行加权。

**放射组学、临床和组合模型的性能比较**
图3展示了三个队列中放射组学得分(Rad-score)和甲状腺外扩展(ETE)状态的分布。Mann-Whitney U检验显示ETE组和非ETE组之间的Rad-score存在统计学上的显著差异(p<0.001)。此外,单变量和多变量回归分析确定Rad-score是与ETE相关的独立因素。多变量分析确认C-TIRADS 4c、年龄≥55岁、侧淋巴结转移、结节与甲状腺包膜的接触、肿瘤-气管角度、与气管食管沟的接触是ETE的独立预测因子,并将这些因素纳入临床模型。最终,通过将Rad-score与这些独立的临床预测因子结合,开发了组合模型(表2)。图4显示了放射组学模型、临床模型和组合模型的性能。构建的放射组学模型包含七个选定特征,在训练、内部验证和外部验证队列中的曲线下面积(AUC)分别为0.813(95% CI:0.763–0.862)、0.838(95% CI:0.764–0.911)和0.833(95% CI:0.735–0.930)。这七个特征分别是:original_firstorder_Minimum、original_glcm_ClusterShade、original_glrlm_LongRunHighGrayLevelEmphasis、original_glszm_GrayLevelNonUniformity、original_glszm_SizeZoneNonUniformityNormalized、original_glszm_ZoneVariance和wavelet.LH_glszm_LowGrayLevelZoneEmphasis。这些特征代表了一阶统计量、纹理特征(GLCM、GLRLM、GLSZM)和小波变换特征,捕捉了超声图像上肿瘤的强度分布、空间异质性和频域信息。

根据德隆测试(DeLong test),组合模型与临床模型在训练和内部验证队列中的AUC差异具有统计学意义(p=0.001和p=0.03)。在外部验证队列中,组合模型的AUC为0.857(95% CI:0.768–0.946),而临床模型的AUC为0.782(95% CI:0.674–0.889),尽管这种差异没有统计学意义(p=0.11)。德隆测试还表明,在训练队列中组合模型与放射组学模型之间的AUC也存在统计学上的显著差异[AUC=0.898(95% CI:0.863–0.934)vs. 0.813(95% CI:0.763–0.862);p<0.001]。然而,在内部验证队列[AUC=0.873(95% CI:0.810–0.936)vs. 0.838(95% CI:0.764–0.911);p=0.28]或外部验证队列[AUC=0.857(95% CI:0.768–0.946)vs. 0.833(95% CI:0.735–0.930);p=0.56]中未检测到统计学上的显著差异。

诺模图将放射组学特征和常见临床因素整合成一个可视化工具,有助于促进临床咨询和患者教育。组合模型被转换为诺模图,诺模图中的总点数对应于ETE发生的预测风险(图5(a))。校准曲线显示组合模型的预测与实际观察到的ETE状态在所有三个队列中都有很好的一致性(图5(b–d))。布里尔分数提供了关键的定量证据,训练、内部验证和外部验证队列的分数分别为0.123、0.134和0.169——均较低。这定量证明了模型预测概率的出色校准和整体准确性。决策曲线分析进一步表明,组合模型在内部和外部验证集的大多数阈值概率下都产生了更高的总体净收益(图5(e, f))。表3提供了所有三种模型预测性能的总结。

**亚组分析**
亚组分析的结果总结在表4中。组合模型在不同临床特征分层的所有亚组中均表现出对ETE的区分能力。

在按侵袭程度分层的亚组中,组合模型在重度ETE亚组的曲线下面积(AUC)为0.966(95% CI:0.942–0.990),在轻微ETE亚组的AUC为0.866(95% CI:0.829–0.904),两组之间的AUC存在统计学上的显著差异(p<0.001)。在肿瘤大小亚组中,模型在微小癌亚组的AUC为0.834(95% CI:0.785–0.882),在非微小癌亚组的AUC为0.870(95% CI:0.755–0.986),组间差异不显著(p=0.565)。此外,有桥本甲状腺炎(Hashimoto’s thyroiditis)的亚组与没有桥本甲状腺炎的亚组之间的模型性能相当(AUC:0.907,95% CI:0.866–0.948 vs. AUC:0.879,95% CI:0.833–0.924;p=0.270)。同样,在甲状腺功能正常(AUC:0.891,95% CI:0.848–0.934)和甲状腺功能异常(AUC:0.896,95% CI:0.852–0.941;p=0.871)的亚组之间,性能也没有统计学上的显著差异。

**讨论**
本研究系统地开发并验证了一个用于术前预测PTC患者甲状腺外扩展(ETE)的组合模型,基于420名患者的训练和内部验证队列,以及70名患者的独立外部测试队列。该模型整合了七个关键放射组学特征、C-TIRADS 4c、年龄≥55岁、侧淋巴结转移和肿瘤与气管之间的解剖学特征。验证结果表明,组合模型在训练队列中的AUC为0.898(95% CI:0.863–0.934),显著优于临床模型(p=0.001)和放射组学模型(p<0.001)。它在内部验证队列中的性能同样强劲,AUC为0.873(95% CI:0.810–0.936),显著优于临床模型(p=0.03),并在外部独立验证中表现出良好的泛化能力(AUC=0.857)。此外,亚组分析确认了模型在关键亚组中的一致性能。值得注意的是,该模型在按侵袭程度分层的亚组中显示出有利的AUC,无论是轻微ETE(AUC 0.866)还是重度ETE(AUC 0.966),尽管组间比较显示了统计学上的显著差异(p<0.001)。相比之下,按肿瘤大小或桥本甲状腺炎状态分层的亚组之间没有观察到模型性能的显著差异(所有p>0.05)。这些发现表明,本研究建立的组合模型为PTC患者的术前ETE风险评估提供了一个客观、稳健和多维的预测工具。

根据国家综合癌症网络(NCCN)指南,gETE是全甲状腺切除术的明确指征。gETE在临床上具有重要意义,因为它对患者预后有显著影响。证据表明,gETE患者的肿瘤复发率更高,总体生存期更短,不良后果的发生率超过50%。同样,淋巴结转移和远处转移的风险也显著增加。相比之下,mETE的临床意义仍有争议。尽管AJCC癌症分期手册第8版已将mETE从pT3疾病的定义中移除,但美国甲状腺协会的指南仍将其归类为中等风险类别[引用19]。此外,多项研究已经证实,mETE是PTC(乳头状甲状腺癌)患者持续/复发疾病的独立预测因子,并且与无病生存期缩短有关[Citation20,Citation21]。鉴于mETE、gETE与其临床预后之间的这种明确关联,我们的研究将两者都归类为ETE以进行后续分析。需要强调的是,准确评估ETE对于精确的甲状腺癌分期至关重要。ETE的状态不仅决定了手术切除范围的适当性以及是否需要积极监测策略,还为外科医生制定个性化的术前计划提供了宝贵的参考。因此,这种方法有助于防止患者接受不必要的广泛手术,从而确保治疗效果的同时降低过度治疗的风险。我们的研究发现,年龄≥55岁和侧淋巴结转移(LLNM)与PTC患者的ETE显著相关。年龄≥55岁的患者ETE的比值比(OR)为2.6,而具有LLNM的患者OR为3.8,这表明这两个参数可能是ETE的潜在风险因素,并为识别高风险人群提供了临床参考。关于年龄与ETE之间的关联,我们的观察结果与现有文献一致。例如,Qi等人[Citation22]之前已经建立了年龄与ETE之间的相关性,而Kuo等人[Citation23]通过多变量分析进一步确定年龄(OR = 1.025)是一个独立的风险因素。通过将55岁作为分界值,我们的研究更准确地捕捉到了老年患者(≥55岁)ETE风险显著升高的情况(OR = 2.6)。这种差异可能源于不同的年龄分层标准,突显了在特定年龄组中进行ETE风险评估的临床重要性。

LLNM与ETE之间存在显著相关性。一项包含15项研究和8,369名临床淋巴结阴性的PTC患者的荟萃分析显示,ETE与LLNM之间存在显著关联(OR = 2.52)[Citation24]。同样,Song等人[Citation25]也证实ETE是淋巴结转移的独立风险因素(OR = 1.852)。从相反的角度来看,我们的研究发现,具有LLNM的患者ETE发生的OR为3.8。这些发现共同表明ETE和LLNM之间存在双向关联,提示在PTC患者中存在LLNM时应提高对ETE的临床怀疑。这需要彻底的术前影像学评估或术中探查,以明确侵袭范围,从而优化手术决策并降低复发风险。

此外,本研究还发现,在单变量分析中识别出的一些具有临床意义的变量(如多灶性)并未被纳入最终的多变量模型中。这可能是由于变量之间的共线性,或者是因为它们的预测信息已经被模型中其他更具代表性的变量(如侧颈淋巴结转移和结节与甲状腺包膜的接触)所包含。多变量建模旨在识别独立预测因子;因此,它优先保留贡献最大且临床解释性最强的变量。先前的研究已经确定,特定的超声特征(如肿瘤侵犯带状肌、气管或RLN)对ETE的术前诊断具有参考价值[Citation9,Citation26,Citation27]。我们的结果进一步证实了这一结论:多变量逻辑回归分析确定结节与甲状腺包膜的接触(OR = 2.5)和结节与TEG结构的接触(OR = 2.2)是ETE的独立预测因子。这些发现与先前的报告数据大体一致,再次强调了这些超声特征在术前ETE评估中的临床重要性。在此基础上,我们的研究扩展了超声评估的维度。我们将与肿瘤边缘相关的解剖特征——如肿瘤与气管之间的角度和结节与TEG的接触——与中国甲状腺影像报告和数据系统(C-TIRADS)分类及相关临床病理因素结合起来。这种整合形成了一种新的评估策略,综合了解剖特征、影像分类和生物学行为,为临床实践中更全面和精确的ETE术前预测提供了新的视角。

传统上,理解癌症相关的生物学行为和分子生物学依赖于侵入性活检程序。相比之下,放射组学作为一种快速、成本效益高且无创的影像生物标志物出现[Citation28–30],可能为肿瘤评估提供有希望的替代方案。此外,放射组学可以通过提供定量影像特征来克服传统影像解读中的主观性[Citation31–33],从而在肿瘤影像学领域开辟新的前沿。它在提取有价值的医学见解和提高临床鉴别诊断的准确性方面具有巨大潜力。先前的研究已经证明了超声衍生放射组学特征在评估ETE中的实用性[Citation34]。在我们的研究中,我们最初从超声图像中提取了849个潜在的放射组学特征。通过类内相关系数(ICC)和特征筛选后,我们使用最小绝对收缩和选择算子(LASSO)回归模型进行进一步降维,最终确定了7个核心放射组学特征作为构建ETE预测模型的预测因子。选定的放射组学特征被分为三类(一阶特征、纹理特征和小波特征),所有这些特征在非ETE组和ETE组之间都显示出显著差异。这些特征主要捕获了来自超声图像中的像素强度和纹理模式的信息。一阶特征主要描述了病变的内部纹理属性。纹理特征,包括从灰度共生矩阵、灰度游程长度矩阵和灰度大小区域矩阵中提取的特征,描绘了像素及其相邻像素之间的空间关系。小波特征主要反映了病变内的时频域特征[Citation35]。在选定的超声放射组学特征中,小波特征‘wavelet.LL_glszm_LowGrayLevelZoneEmphasis’以及纹理特征‘original_glszm_GrayLevelNonUniformity’和‘original_glszm_SizeZoneNonUniformityNormalized’在预测ETE方面表现出高显著性和稳健性。它们分别描述了超声图像中病变区域内的时频域特性和空间纹理分布的异质性。在某种程度上,超声放射组学本身构成了一种定量方法。定量超声评估已应用于ETE诊断、风险分层和治疗计划的各个方面。Jiang等人[Citation18]报告了一个基于增强超声(CEUS)特征的评估模型,该模型结合了影像和临床数据的关键特征,利用放射组学分析作为PTC中ETE的预测工具。他们发现他们的集成模型优于仅使用单一定量参数构建的模型。我们的研究同样建立了一个结合临床、常规超声和放射组学特征的模型。值得注意的是,我们的组合模型在测试队列中的AUC为0.898,显著优于仅基于单个超声或临床特征的模型。这些结果证实了多模态模型在诊断ETE方面的优越性。虽然临床医生通常根据年龄等临床因素来制定PTC患者的治疗策略,但我们的多模态放射组学-临床模型(在测试队列中的AUC = 0.873)的表现优于仅基于临床特征的预测模型(AUC = 0.782)。此外,在外部验证集中,我们的组合模型保持了0.857的稳健性能,优于单模态模型,尽管差异在统计上不显著。

为了进一步验证我们模型的适用性,我们考虑到不同的疾病背景和肿瘤特征可能会显著影响ETE的表现和诊断挑战[Citation36,Citation37]。因此,我们研究了组合模型在四个不同患者亚组中的表现。亚组分析表明,该模型在预测ETE方面表现出广泛的稳健泛化能力。在不同侵袭程度的亚组中,该模型对广泛ETE(AUC = 0.966)和轻微ETE(AUC = 0.866)都具有高预测能力,尽管这些组之间的AUC存在统计学上的显著差异(p < 0.001)。在基于肿瘤大小的亚组中,该模型对微癌(AUC = 0.834)和非微癌(AUC = 0.870)的预测效果相当(p = 0.565)。此外,无论Hashimoto甲状腺炎的状态(AUC:0.907 vs. 0.879,p = 0.270)或甲状腺功能状态(AUC:0.891 vs. 0.896,p = 0.871)如何,该模型始终保持了稳定的分类性能。包括准确性、敏感性和特异性在内的指标在所有亚组中保持一致。总之,组合模型在按侵袭程度、肿瘤大小、Hashimoto甲状腺炎状态和甲状腺功能分层的多个临床亚组中表现出一致且可靠的预测性能,表明其在临床应用中的广泛潜力。

然而,这项研究也存在一些局限性。其回顾性的多中心设计引入了样本选择偏差的可能性。未来的研究应纳入更大规模、前瞻性收集的多中心数据集,以提高样本的代表性。其次,模型使用的超声特征评估——如结节与甲状腺包膜的接触和肿瘤与气管之间的角度——在一定程度上依赖于操作者的经验和判断,引入了一定程度的主观性。这些评估的观察者间和观察者内一致性需要在前瞻性设置中进一步标准化和验证。未来,我们计划进行大规模、前瞻性的多中心研究来验证和完善这一模型,同时探索其与人工智能辅助诊断系统的整合,以提高客观性和临床实用性。

总之,基于超声放射组学的组合模型在预测甲状腺癌的甲状腺外扩展方面表现出出色的诊断性能。它不仅在整体队列中保持了稳健的预测能力,而且在按侵袭程度、肿瘤大小、伴随的Hashimoto甲状腺炎和甲状腺功能状态分层的关键临床亚组中也同样如此。随着人工智能在超声诊断中的不断整合,这种可量化和直观的诺模图模型在临床转化方面显示出巨大潜力。未来的研究应重点关注其在前瞻性队列中的验证以及与临床工作流程的整合,从而支持甲状腺癌患者ETE的自动化和精确超声评估。

数据可用性声明
支持本研究结果的数据可从相应作者(P.X., xupan_1989@126.com)处获得,需经南昌大学第一附属医院伦理委员会批准,并在合理请求下提供。

生物通微信公众号
微信
新浪微博


生物通 版权所有