基于放射组学和机器学习的食管癌术前CK19表达探索性预测模型的建立

时间:2026年6月2日
来源:PLOS One

编辑推荐:

摘要 背景 食管癌是全球最致命的恶性肿瘤之一,由于区域性饮食习惯,在中国广东—潮汕地区尤为高发。细胞角蛋白19(CK19)是一个重要的免疫组织化学标志物,反映肿瘤的侵袭性和转移潜能;然而,目前尚无法实现术前无创预测CK19表达。本研究旨在开发一种基于CT的放射

广告
   X   

摘要
背景
食管癌是全球最致命的恶性肿瘤之一,由于区域性饮食习惯,在中国广东—潮汕地区尤为高发。细胞角蛋白19(CK19)是一个重要的免疫组织化学标志物,反映肿瘤的侵袭性和转移潜能;然而,目前尚无法实现术前无创预测CK19表达。本研究旨在开发一种基于CT的放射组学模型,结合机器学习来术前预测CK19表达。
方法
本研究纳入了134名原发性食管癌患者。所有患者均在术前接受了增强CT扫描,并通过术后病理分析评估了CK19表达。研究人员利用放射组学技术从CT图像中提取多维图像特征,包括形态、纹理和一阶特征。通过结合梯度提升决策树(GBDT)、随机森林(RF)、极端梯度提升(XGB)和轻量级梯度提升机(LGBM)等机器学习模型建立了预测模型,并利用SHAP值分析了模型的可解释性。
结果
在所比较的模型中,随机森林模型表现出相对较高的准确率和精确度,其AUC值为0.6765,准确率为0.8293。GBDT表现出更均衡的性能(AUC:0.6597),而XGB(AUC:0.6744)和LGBM(AUC:0.6807)显示出相似但总体稍低的判别能力。特征重要性分析表明,小波变换后的特征对预测结果有显著贡献。结果验证了放射组学结合机器学习技术在CK19表达术前预测中的潜力。
结论
本研究开发了一种基于放射组学和机器学习、用于食管癌患者CK19标志物评估的探索性术前无创预测模型,该模型在探索性设定中显示出适度的预测性能,可能为进一步探索精准医学提供初步支持。未来,该模型的临床适用性需要进一步验证,并在更大的人群中优化其推广应用。
**论文解读:基于放射组学与机器学习的食管癌术前CK19表达探索性预测模型**

**一、研究背景与问题**

食管癌是全球第八大常见癌症,也是癌症相关死亡的第六大原因,尤其在广东潮汕地区因热茶饮用等饮食习惯而发病率极高。尽管医学治疗不断进步,但多数患者确诊时已处于晚期,总体预后不佳。目前,疾病状态评估主要依赖计算机断层扫描(CT)、磁共振成像(MRI)和正电子发射断层扫描(PET)等先进影像学手段,以及检测关键分子生物标志物的免疫组织化学技术。然而,传统影像诊断存在主观性强、可重复性差等局限性。影像生物标志物研究已显示出定量特征与上消化道肿瘤临床相关结局的关联,为食管癌放射组学发展提供了方法学支持。已有研究表明CT放射组学特征在预测淋巴结转移、评估新辅助治疗后反应及生存分层中具有价值。然而,现有放射组学研究多集中于分期或疗效评估,对于能否无创反映食管癌分子表型或免疫组化标志物的探索仍然有限。

在本研究的背景下,细胞角蛋白19(CK19)是一种上皮中间丝蛋白,有助于食管肿瘤上皮表型的表征,并为病理评估提供补充性免疫组化信息。既往研究提示,涉及CK19的细胞角蛋白表达与分布模式可能与食管鳞状细胞癌的疾病进展、淋巴结转移和预后相关。因此,开发一种基于CT影像的无创CK19表达预测模型具有重要的临床意义。本研究旨在利用术前CT图像,通过放射组学技术与机器学习方法,建立一个探索性的CK19表达预测模型,以弥合影像数据与分子标志物预测之间的鸿沟,提高诊断精确度,并为食管癌患者制定个体化治疗策略提供新工具。

**三、主要关键技术方法**

该研究为一项单中心回顾性研究,样本来源于汕头大学医学院附属肿瘤医院,最终纳入2015年至2022年间接受手术治疗的134名原发性食管癌患者(排除标准包括术前接受放化疗、CT数据质量不足及病理结果缺失者)。主要关键技术包括:1)**影像获取与肿瘤分割**:采用两台CT扫描仪(GE BrightSpeed 16排与Philips Ingenuity 64排)采集静脉期增强CT图像,由两位放射科医生使用3D Slicer软件进行盲法手动分割感兴趣区域(ROI);2)**影像特征提取与筛选**:使用Pyradiomics工具包提取包含形态、纹理、一阶统计等在内的多维放射组学特征,通过组内相关系数(ICC)评估稳定性,t检验筛选与疾病状态显著相关的特征,并利用套索回归(Lasso)进行特征选择,最终筛选出11个关键特征;3)**机器学习建模与评估**:构建了梯度提升决策树(GBDT)、随机森林(RF)、极端梯度提升(XGB)和轻量级梯度提升机(LGBM)四种模型,数据按7:3比例随机分为训练集和测试集,采用准确率、召回率、精确率、F1分数和受试者工作特征曲线下面积(AUC)等指标评估性能,并引入SHAP值进行模型可解释性分析。

**四、研究结果**

**3.1 实验设置**
研究人员在高性能计算工作站上完成所有实验,使用Python 3.7及Scikit-learn、XGBoost、LightGBM等开源库处理数据、提取特征并训练模型。数据在分层随机抽样下按7:3分为训练集和测试集,以保证各组中CK19阳性与阴性病例比例一致。

**3.2 特征提取与筛选结果**
从134名患者的术前增强CT图像中共提取了993个放射组学特征,包括320个原始图像特征和673个小波变换生成的特征。经过Lasso回归初步筛选,得到72个显著特征;通过交叉验证优化正则化参数后,最终确定了11个最关键的放射组学特征。这些特征中,`wavelet- HLL_glszm_GrayLevelNonUniformityNormalized`、`logarithm_glszm_LargeAreaHighGrayLevelEmphasis`和`exponential_ngtdm_Complexity`等在预测模型中影响显著。

**3.3 术前CK19表达的无创预测结果**
通过比较四种机器学习模型(GBDT、RF、XGB、LGBM)的性能,发现随机森林(RF)模型表现相对较好,准确率为0.8293,精确率为0.6824,召回率为0.6134,F1分数为0.6325,AUC值为0.6765。GBDT模型表现出更均衡的性能,其F1分数(0.6328)略高。XGB和LGBM性能相近但有下降趋势(AUC分别为0.6744和0.6807)。针对RF模型的具体性能分析显示,校准曲线表明预测概率与真实概率之间具有较好的一致性;ROC曲线AUC为0.6765,表明模型对正负样本具有一定的区分能力;决策曲线分析表明,RF模型在有限的阈值概率范围内能产生净收益,但在相当一部分阈值范围内净收益低于零;混淆矩阵显示RF模型能准确识别大部分阴性样本(32/34),但对阳性样本的预测存在不足(2/7)。

**3.4 SHAP可视化分析**
通过SHAP(SHapley Additive exPlanations)值分析,揭示了RF模型预测机制,并提高了临床可解释性。分析显示,`wavelet- HLL_firstorder_Median`和`exponential_firstorder_Uniformity`是对模型预测结果影响最显著的两个特征。`wavelet- HLL_firstorder_Median`的高值主要推动预测值向正向移动,提示其在CK19阳性表达样本中具有较高特征值;而`exponential_firstorder_Uniformity`的低值也对正向预测结果产生影响,表明这些特征值的降低可能与CK19阳性状态相关。其他重要特征还包括`wavelet- LLH_gldm_DependenceNonUniformityNormalized`和`logarithm_glszm_LargeAreaHighGrayLevelEmphasis`等。

**五、总结与讨论**

**讨论部分总结**:本研究通过结合放射组学与机器学习,基于术前CT图像成功开发了无创评估食管癌患者CK19表达的探索性预测模型。在多个模型中,RF模型显示出相对较高的准确性和稳定性,AUC为0.6765,准确率为0.8293。考虑到数据集的类别不平衡(83% CK19阴性 vs. 17% CK19阳性),研究人员补充报告了平衡准确率(0.613)和马修斯相关系数(0.288),表明模型判别能力中等。SHAP分析明确了关键特征的贡献,如`wavelet- HLL_firstorder_Median`和`exponential_firstorder_Uniformity`等。研究认为,CK19表达不仅是一个结构指标,更与肿瘤分化和侵袭性密切相关;CT图像提取的宏观异质性特征可作为肿瘤内部生物学无序状态的替代指标。RF模型的优势在于能稳健建模这些复杂的非线性关系。该模型为术前无创评估CK19表达提供了新方法,有助于指导更积极的外科治疗或辅助治疗方案。然而,研究存在局限性:单中心回顾性设计、样本量适中(134例)、测试集中仅7例阳性、类别不平衡未施加平衡技术、缺乏外部验证及置信区间报告、未收集临床数据等。研究人员未在探索性研究中应用类别均衡技术,也未报告性能指标的95%置信区间或进行模型间的正式统计比较。未来需要在多中心大样本中验证,并结合多模态影像数据优化模型性能。

**结论部分翻译**:本研究成功构建了一种基于放射组学和机器学习的术前无创预测模型,用于评估食管癌患者CK19标志物的表达。通过结合高质量的CT图像特征提取、Lasso特征筛选以及对多种机器学习算法的比较,RF模型在预测性能和临床适用性方面表现最佳。模型的可解释性分析进一步揭示了关键特征对预测结果的贡献,为模型的临床应用提供了科学依据。未来需要多中心验证和多模态图像融合来优化模型性能,并促进其在临床实践中的广泛应用。

生物通微信公众号
微信
新浪微博


生物通 版权所有