Data collection 研究定义的不良临床结局为症状出现后30 d内发生以下至少一项:入住ICU、需要干预治疗或全因死亡。干预包括内镜逆行胰胆管造影(ERCP)、经皮引流、内镜或外科坏死组织清除、胆道支架置入、胰管支架置入及开腹手术等。该复合终点旨在覆盖具有明确临床意义的病情恶化事件,用于建立更贴近实际临床决策的早期风险预测模型。
CT image acquisition and image interpretation 研究使用Canon TSX-305 A/5K和Brilliance-Philips扫描仪完成CECT采集,并从影像归档与通信系统(PACS)中回顾性提取图像。两名具有5年经验的腹部放射科医师分别使用LIFEx 7.4.3软件对胰腺及胰周水肿区域进行体积三维分割,且相互盲法;另由1名具有15年经验的高级腹部放射科医师确认分割质量与一致性。该步骤为后续影像组学特征提取和深度学习建模提供了标准化感兴趣区。
Intra-observer reliability and inter-observer agreement for segmentation 通过Dice相似系数(DSC)及Cohen’s κ系数评估分割重复性。结果显示,胰腺和胰周区域的观察者间DSC分别为82.9%和74.8%,观察者内DSC分别为87.1%和80.5%;两类区域的Cohen’s κ均超过0.70。说明研究中的人工分割具有较好一致性,为模型训练中的影像表征稳定性提供了方法学支持。
Radiologist-based imaging-only assessment for outcome analysis 3名具有5至7年经验的放射科医师在仅知晓研究终点、不掌握临床资料的条件下,对CECT进行盲法二分类预后评估。其判断依据包括胰周炎症范围、胰腺坏死及其他腹部CECT胰外表现,基本遵循Balthazar计算机断层扫描严重度指数(CTSI)的思路。结果显示,人工视觉评估的平均AUC约为0.63,平均敏感度仅42.5%,多数投票AUC为0.61,且观察者间一致性为中等水平。该结果说明,早期AP中仅依赖人工影像解读难以可靠识别后续会发生不良结局的患者,尤其对隐匿性高风险病例较不敏感。
Deep learning analysis 研究在CECT体数据上应用平滑后的胰腺掩膜,对目标区域进行裁剪与重采样,输入尺寸为96 × 96 × 128体素,并从头训练三维DenseNet-264网络。训练过程中采用Adam优化器、交叉熵损失和随机空间旋转增强,同时使用掩膜限制的全局平均池化以强化胰腺组织相关特征聚合。结果显示,纯影像DL模型AUC为0.76,具有较高特异度和阳性预测值(PPV),性能与影像组学模型接近,但在整合实验室参数后总体获益有限,AUC仅边际变化,未超过影像组学-临床模型。
Fusion model development 研究进一步采用基于堆叠(stacking)的融合框架,将DL输出logits、影像组学决策分数及实验室变量组合为多模态特征向量,并以Logistic回归作为元学习器。尽管该融合设计理论上能够集成不同模型优势,但结果显示其AUC约为0.76,无论是否加入实验室变量均未超越单独的影像组学模型。该结果提示,在早期AP中,DL与影像组学可能捕捉到部分重叠的信息,复杂融合并未带来额外增益。SHAP分析进一步指出,对模型预测影响较大的特征包括胰腺区域的original_shape_MeshVolume、original_glrlm_RunLengthNonUniformity、wavelet-LLL_firstorder_Skewness,以及胰周水肿区域的lbp-2D_firstorder_Mean和wavelet-HLH_glszm_GrayLevelNonUniformity,这些特征主要反映组织异质性、水肿复杂性、胰腺形态改变和坏死演变等早期病理过程。
Statistical analysis and comparative performance 在284例患者中,140例发生不良临床结局,占49.3%。传统评分体系中,Ranson评分AUC为0.61,Glasgow-Imrie评分AUC为0.67,判别力均有限。相比之下,影像组学和DL模型均取得更高AUC。加入WBC、尿素氮/肌酐比值、CRP、LDH及白蛋白后,影像组学多模态模型获得最明显提升,AUC增加2.84个百分点至0.80,且差异具有统计学意义。决策曲线与校准曲线分析显示,影像组学单模态模型和多模态模型均具备可接受的临床净获益和较好的校准性能。