综述:人工智能在肝细胞癌中的转化悖论:从算法过度工程化到真实世界临床效用

时间:2026年5月20日
来源:Frontiers in Oncology

编辑推荐:

综合 2025 年至 2026 年的最新文献,这篇小型综述批判性地评估了人工智能(AI)在肝细胞癌(HCC)中从静态模式识别向机制驱动的空间和影像诊断的方法论演变。研究人员揭示了一个关键的转化悖论:尽管自监督视觉基础模型(VFMs)、基于苏木精 - 伊红(H&

广告
   X   

综合 2025 年至 2026 年的最新文献,这篇小型综述批判性地评估了人工智能(AI)在肝细胞癌(HCC)中从静态模式识别向机制驱动的空间和影像诊断的方法论演变。研究人员揭示了一个关键的转化悖论:尽管自监督视觉基础模型(VFMs)、基于苏木精 - 伊红(H&E)染色的无监督域适应虚拟分子谱分析以及 AI 协同的空间转录组学在理论上能够解码肿瘤内异质性并缓解跨病因的域偏移,但这些复杂的架构尚未在真实世界的多扫描仪队列中得到验证。相反,稳健的比较分析对现行的多模态叙事提出了挑战,证明算法的效用高度依赖于数据:虽然复杂 AI 对于高维环境至关重要,但在低维生存预测中,传统的 Cox 模型相比高度工程化的大型语言模型(LLMs)仍表现出极高的鲁棒性和竞争力,表明算法复杂度并不必然等同于临床效用。为了打破这一转化僵局,这篇小型综述认为该领域必须紧急从脆弱的后验可解释性转向固可解释架构(如概念瓶颈模型 [CBMs]),并呼吁在未来 24 个月内将这些透明系统严格整合到 II 期“机会窗口”随机试验和动态监管评估框架中。
肝细胞癌(HCC)作为最常见的原发性肝脏恶性肿瘤,是全球癌症相关死亡的主要原因。目前的临床管理严重依赖标准化分期系统和形态学评估,但这些传统范式受到观察者间差异的阻碍,且无法无创地捕捉肿瘤内异质性(ITH)。此外,其僵化的决策算法常难以适应个体化的肿瘤生物学特征和新兴的预测性生物标志物。人工智能(AI)的快速整合为完善 HCC 筛查方案及规避这些诊断瓶颈提供了关键机遇。在 2025 年初至 2026 年间,计算肿瘤学领域经历了从概念验证模型到临床可操作工具的关键方法论演变,实现了宏观和微观尺度上深层多维数据的提取。

**医学影像中 AI 的局限性与对域偏移的结构性脆弱**
增强计算机断层扫描(CT)和磁共振成像(MRI)仍是 HCC 监测的基石。尽管 AI 模型在自动化肿瘤描绘方面表现出色,例如 SALSA 框架在肝脏肿瘤分割方面已超越专家共识,但在整合到真实世界临床工作流时,它们表现出严重的结构性脆弱。具体而言,利用大型语言模型(LLMs)辅助肝脏影像报告和数据系统(LI-RADS)分类的研究显示,虽然理论准确率较高,但该模型对不同医疗机构间报告术语的微小变化极为敏感,易受“语义漂移”影响导致误分类。在基于像素的计算机视觉(CV)领域,“域偏移”仍是临床转化的主要障碍。尽管基于钆贝葡胺(Gd-BOPTA)MRI 的多层感知机(MLP)深度学习模型或放射病理融合模型在预测包裹肿瘤簇血管(VETC)方面显示出优异的内部有效性(曲线下面积 [AUC] > 0.85),且对比增强 CT 的放射组学生态位分析可预测程序性死亡配体 1(PD-L1)表达及早期复发,但这些算法不可避免地会过拟合于其来源机构的特定成像参数。当前的突破在于减少对手动标注监督学习的依赖,全面探索自监督学习(SSL)和视觉基础模型(VFMs)。通过在大规模、异质性且未标注的医学图像上进行预训练,这些前沿模型学习了肝脏解剖和肿瘤生长的普遍流形结构,理论上仅需少量样本学习即可抵抗域偏移。

**数字病理与基于 H&E 的虚拟分子谱分析**
传统的苏木精和伊红(H&E)染色切片病理审查本质上是定性的,而 AI 加速了向定量计算病理学的转变,实现了直接从标准切片进行“虚拟分子谱分析”。这一进展对于预测由代谢功能障碍相关脂肪性肝病(MASLD)等新发病因驱动的 HCC 发展尤为相关。AI 驱动的模型已能从标准 H&E 图像中直接识别高侵袭性的多倍体 HCC,替代昂贵的荧光原位杂交(FISH)测试;还能仅基于 H&E 切片上基质成分和淋巴细胞的空间拓扑排列推断结果相关的分子谱并预测微血管侵犯(mVI)。然而,现有的 AI 病理模型广泛受限于病因偏倚,大多数模型是在乙型肝炎病毒(HBV)驱动的东亚人群队列上训练的,难以准确捕捉毒素或 MASLD 驱动的 HCC 特有的基质重塑架构。为解决这一跨病因域适应挑战,前沿算法正转向无监督域适应(UDA)和迁移学习,并整合因果机器学习以剥离病因特异性混杂因素,提取核心的全病因病理特征。

**医学人工智能中的生存预测分析**
准确预测治疗后的生存轨迹对于优化随访策略至关重要。系统性的荟萃分析证实,在利用高维数据预测肝切除术后复发时,机器学习(ML)模型优于传统方法。随机生存森林(RSF)等模型进一步优化了无病生存期(DFS)的预测。在局部和系统治疗领域,自动化自然语言处理(NLP)模型已用于提取电子健康记录(EHR)数据以分层经动脉化疗栓塞(TACE)后的风险。然而,近期研究提供了重要的方法论反思:Li 等人的比较研究表明,在预测中晚期 HCC 的长期进展方面,传统的 Cox 比例风险(CPH)回归模型比先进的 LLMs 更稳健、更准确。随后的荟萃分析进一步证实,在处理低维表格临床数据时,复杂的 ML 模型相较于标准 CPH 模型仅提供边际效用。这客观凸显了在临床肿瘤学研究中,必须根据数据维度调整算法复杂度,避免“过度工程化”。

**解码高维肿瘤异质性:空间转录组学与 AI 的协同**
HCC 中的肿瘤内异质性(ITH)是治疗耐药和免疫逃逸的核心驱动因素。整合 AI 算法(如空间去卷积、非负矩阵分解 [NMF] 和图神经网络 [GNNs])与空间转录组学(ST),能够精确绘制空间细胞通讯网络图谱。近期关键研究利用 AI 解码了恶性肝细胞与肿瘤微环境(TME)之间的相互作用,揭示了 HCC 克隆作为主动的核心驱动因素,重塑局部代谢网络并将肿瘤相关巨噬细胞(TAMs)推向免疫抑制表型。尽管 AI 驱动的空间多组学提供了深刻的机制见解,但高昂的测序成本阻碍了常规临床转化。未来的突破将依赖于利用深度学习算法将 ST 定义的高维空间生物标志物映射回普遍可及的常规 H&E 切片,例如通过生成对抗网络(GANs)或扩散模型驱动的 AI 虚拟染色技术,直接从 H&E 图像预测空间转录组表达分布。

**HCC 中 AI 的新兴应用与技术范式**
多模态和多组学数据的宏观整合正日益系统化。基于 Transformer 的跨模态注意力机制的引入,使前沿 AI 框架能够在 CT 空间特征、H&E 病理切片和基因组序列之间实现高效的异质对齐。这种深层语义交互机制显著推动了个性化治疗网络的构建。此外,ML 算法已开始识别特定人群(如非洲人群)的定制代谢组学生物标志物,促进了肿瘤研究的公平性。在药物发现方面,深度学习框架简化了从预后生物标志物提取到靶向配体推荐的计算工作流程。“术中 AI"也正在兴起,利用 CV 动态指导手术切口和评估边缘。最终,评估 LLMs 提供符合巴塞罗那临床肝癌(BCLC)分期治疗建议的潜力,彰显了 AI 作为稳健临床决策支持工具的未来前景。

**结论与未来展望**
2025 年至 2026 年的文献确立了 AI 作为 HCC 精准肿瘤学方法论演变的核心驱动力。然而,传统统计模型在处理低维表格数据时持续优于复杂 LLMs 的客观证据,强调了临床实践中谨慎选择算法的必要性。未来,医学 AI 必须超越对 SHAP 或 LIME 等“后验可解释性”工具的过度依赖,全面转向“固可解释模型”,如概念瓶颈模型(CBMs)。CBMs 通过首先预测人类可理解的中间临床概念(如脂肪变性程度、mVI 存在与否),再据此得出去 prognostic 决策,使肿瘤学家能够在做治疗决定前验证或修正中间变量。最终,临床转化不能局限于计算机模拟验证,必须将这些具备多模态融合能力的模型严格整合到前瞻性的“机会窗口”临床试验或随机对照试验(RCTs)中,并建立针对软件即医疗设备(SaMD)的动态评估框架,以应对监管机构面临的挑战。

生物通微信公众号
微信
新浪微博


生物通 版权所有