随着精准肿瘤学(Precision Oncology)从“靶向药物×单一生物标志物”向“多层组学×真实世界数据×适应性试验”演进,其临床实施范围正不断扩大,但标准化、成本效益和数据协调等挑战依然存在。在此背景下,近年来快速发展的生成式人工智能(Generative AI)作为一种连接文献、指南、试验方案和患者数据的辅助技术,有望成为推动效率提升和采纳的关键力量。这篇综述深入探讨了如何将生成式AI可靠地部署于精准肿瘤学实践,并规划了走向“学习型肿瘤学”的实施路径。
生成式AI在医疗领域的发展现状
生成式AI并非新生事物,其发展历程深远。早期的限制玻尔兹曼机(Restricted Boltzmann Machines, RBM)和深度信念网络(Deep Belief Networks, DBN)奠定了理论基础。随后,变分自编码器(Variational Autoencoders, VAE)、生成对抗网络(Generative Adversarial Networks, GAN)以及2017年提出的Transformer架构,共同构成了现代生成式AI,特别是大语言模型(LLMs)、视觉语言模型(VLMs)和扩散模型的核心。在医疗领域,生成式AI的应用正围绕几个核心场景展开:医学问答与决策支持、电子健康记录笔记起草与结构化、影像报告生成、合成电子健康记录数据、患者分诊与健康聊天机器人,以及生成式AI赋能的图像重建。
具体而言,在医学问答方面,Med-PaLM 2等专业模型在医学资格考试(如USMLE)式基准测试中表现出色。在临床记录方面,诸如DAX Copilot等环境AI工具已集成到电子健康记录(EHR)工作流中,能够实时生成就诊记录草稿,旨在减轻医生的文书负担。在影像学领域,经过精细调优的视觉语言模型(如Flamingo-CXR)生成的胸部X光报告,在专家评估中已达到与人类报告相当甚至更优的水平,特别是在无异常发现的病例中。然而,人机协作模式被证明能显著提升报告质量,凸显了辅助而非完全自动化的应用价值。此外,利用Transformer架构合成逼真的电子健康记录数据(如CEHR-GPT、HiSGT、SynEHRgy等模型),为医疗研究中的数据共享和模型训练提供了隐私保护的解决方案。
生成式AI在精准肿瘤学的三大应用轴线
本综述将生成式AI在精准肿瘤学的应用潜力归纳为三个主要轴线:
轴线一:基于生成式AI的基因突变解读与病理意义评估
下一代测序(NGS)的普及产生了海量的基因变异数据。生成式AI,特别是大语言模型,能够整合最新的文献、数据库(如ClinVar、COSMIC)和临床指南,对检测到的变异进行自动解读,评估其致病性、临床意义,并关联可能的靶向治疗或临床试验信息。这可以极大辅助分子肿瘤委员会的工作,提高解读的标准化和效率。
轴线二:生成式AI驱动的临床试验资格验证
临床试验的患者招募,尤其是基于生物标志物的精准匹配,是一项复杂耗时的任务。生成式AI可以自动解析非结构化的临床试验方案文本,提取复杂的入排标准(特别是生物标志物要求),并将其与患者的电子健康记录、基因组学数据进行智能匹配。这不仅能扩大潜在受试者的筛选范围,加速试验入组,也能帮助临床医生为患者发现更匹配的治疗机会。
轴线三:用于成像和病理学的多模态基础模型计算“肿瘤表型”
利用在真实世界临床数据上预训练的多模态基础模型,可以整合组织病理学图像、放射学影像、基因组学和电子健康记录等多维度信息,计算出更全面的“计算肿瘤表型”。这些模型可以辅助生成病理或影像报告草案,从图像中直接推断分子特征(作为分子替代标志物),或发现新的影像组学-基因组学关联,从而促进更深入的分层研究和治疗反应预测。
实现临床可靠部署的核心策略与挑战
尽管前景广阔,但生成式AI在临床部署中仍面临知识新鲜度、幻觉、数据标准化、偏见、隐私、监管和责任等诸多挑战。为此,综述提出了以检索增强生成和人在环路为核心的实践策略。
- •
检索增强生成:通过实时检索最新的、经过验证的知识库(文献、指南、机构数据)来增强生成过程,确保输出的证据基础和可溯源性,是克服模型知识陈旧和幻觉的关键。
- •
人在环路:在所有关键决策点保留临床医生的监督和最终裁定权。AI的输出应被视为供医生审核的草案或参考建议,而非自主决策。
支持这一策略的支柱包括:
- 1.
数据标准化:基于OMOP、mCODE、FHIR等通用数据模型进行数据准备与协调,确保多中心数据的互操作性。
- 2.
前瞻性多中心评估:在真实临床环境中进行前瞻性研究,评估其对临床工作流程、医生决策和患者结局的实际影响。
- 3.
可审计的治理:建立符合良好机器学习实践和欧盟《人工智能法案》等法规要求的审计日志、监控和治理框架,确保透明度和问责制。
- 4.
合成数据策略:采用包含差分隐私等技术的合成数据生成方法,在保护患者隐私的同时,促进数据共享和模型开发。
迈向“学习型肿瘤学”
最终,上述方法旨在通过真实世界结局验证价值,并绘制一条通向“学习型肿瘤学”的路径。这是一个连续的循环:在临床中部署AI辅助工具,利用产生的真实世界数据持续评估其临床有效性,进而更新和优化治疗策略与AI模型,最终在人与AI的协同 oversight 下,加速以患者为中心的决策制定和临床试验开发。生成式AI有潜力成为这一学习引擎的核心催化剂,推动精准肿瘤学进入一个更智能、更高效、更个性化的新时代。