人工智能和机器学习技术在精准肿瘤学中的融合

时间:2025年2月2日
来源:npj Digital Medicine 12.4

编辑推荐:

广告
   X   

人工智能与机器学习技术在精准肿瘤学中的融合研究解读


希腊圣卢克诊所(St Luke’s Clinic)的 Elena Fountzilas 等研究人员在npj Digital Medicine期刊上发表了题为 “Convergence of evolving artificial intelligence and machine learning techniques in precision oncology” 的论文。该论文聚焦于人工智能(AI)和机器学习(ML)技术在精准肿瘤学领域的应用,对于推动肿瘤诊断和治疗策略的进步、改善癌症患者的临床结局具有重要意义。这一研究紧跟科技发展趋势,为解决肿瘤学领域的难题提供了新的思路和方法,有望在未来改变肿瘤治疗的格局。

一、研究背景


随着科技的飞速发展,AI 和 ML 技术逐渐渗透到各个领域,精准肿瘤学也迎来了新的发展契机。精准肿瘤学旨在利用患者的基因、蛋白质和环境信息进行疾病诊断和治疗,而 AI 和 ML 技术能够分析多维、多组学、空间病理学和放射组学数据,助力深入理解肿瘤复杂的分子通路,优化治疗方案的选择。

AI 通过对大量代表性示例(训练数据)的学习,具备识别模式和关系并进行准确预测的能力。早期的 “符号化” 或 “基于规则” 的 AI 系统在处理复杂任务时存在局限性,如 IBM Watson for Oncology 在肿瘤临床决策中与专家临床医生的治疗建议一致性不高。ML 则强调计算机系统通过发现数据中的模式并迭代改进预测性能,可分为有监督学习和无监督学习。深度学习(DL)作为 ML 的子集,聚焦于人工神经网络,在计算机视觉、自然语言处理等领域成果显著,也为肿瘤学研究带来了新的方法。基础模型或大型语言模型(LLMs)如 GPTs 的出现,进一步拓展了 AI 在肿瘤学中的应用潜力,其能够处理多种类型的数据,实现多模态分析,在肿瘤诊断、治疗决策等方面具有广阔的应用前景。

与此同时,肿瘤学领域出现了许多新的疾病深度测量方法,如病理切片的多重数字空间分析、医学图像的定量数字分析、基因组测序和生物分子的质谱分析等。这些技术产生的高维、多模态数据为肿瘤学研究提供了丰富信息,但也带来了分析上的挑战。在这种背景下,将 AI 和 ML 技术应用于精准肿瘤学,不仅有助于应对数据挑战,还能为肿瘤的诊断、治疗和管理提供更精准、有效的手段,因此具有重要的研究价值和临床意义。

二、研究材料和方法


研究人员进行了 PubMed 检索,分别使用 “artificial intelligence” 和 “precision oncology” 以及 “machine learning” 和 “precision oncology” 作为检索词,并限定发表日期为 2020 年 1 月 1 日至 2024 年 11 月 30 日。检索时使用了 “Clinical Study”“Clinical Trial”“Clinical Trial Phase I” 等筛选条件,排除了非癌症相关、未包含 AI 分析以及非原创研究的临床试验。除 PubMed 检索外,研究人员还对已发表的利用 AI/ML 方法分析患者数据的文章进行了综述,筛选标准包括详细描述 AI/ML 方法、纳入患者数据以及提供传统方法未获得的潜在临床新见解。

三、研究结果


3.1 AI/ML 在精准肿瘤学中的应用


3.1.1 数字病理学


  • AI 在自动化免疫组化(IHC)生物标志物评分中的作用:AI 技术有助于标准化 IHC 评估,克服病理学家手动评估的局限性。通过分析肿瘤样本的全切片图像(WSIs),多项研究评估了基于 AI 的自动化定量 IHC 评分系统。例如,多个独立团队利用卷积神经网络(CNNs)展示了 AI 支持的定量 PD-L1 评估的潜力,开发的 CNN 系统能自动检测肿瘤区域并计算 PD-L1 肿瘤比例评分(TPS),与病理学家的评估一致性较高。此外,AI 分析还能识别更多可能从免疫治疗中获益的患者。在乳腺癌诊断中,AI 在 HER2、ER、PR、Ki-67 等蛋白的定量评估方面也展现出优势,提高了评估的准确性和可靠性。
  • 利用 AI 从苏木精 - 伊红(H&E)染色的 WSIs 预测生物学特征:DL 模型如 CNNs 能够从 H&E 染色的 WSIs 中揭示分子特征,预测多种基因的表达和突变情况。研究利用 CNN 分别对乳腺癌患者的 HER2 和 BRCA 表达进行预测,取得了一定的准确率。CNN 模型还可用于预测微卫星不稳定性(MSI)/ 错配修复缺陷(dMMR),帮助筛选适合免疫治疗的患者,为病理工作流程的优化提供了可能。
  • 利用 AI 从 H&E 染色的 WSIs 预测新的预后和预测生物标志物:通过分析 H&E 染色的 WSIs,研究人员借助 CNNs 和视觉变换器等技术,开发了多种预测模型。例如,针对早期结直肠癌患者,相关模型能准确预测临床结局和分子异常情况;在前列腺癌研究中,结合 CNN 分析和临床变量的模型,其预后准确性优于常用的风险分层工具。此外,研究人员还开发了 CNN 肿瘤浸润淋巴细胞(TIL)“分析仪”,通过识别免疫表型,为免疫检查点抑制剂治疗的疗效预测提供了新的视角。

3.1.2 数字放射学(放射组学)


  • 医学图像分析的发展与挑战:医学图像分析领域发展迅速,放射组学通过从标准医疗影像中提取定量图像特征,为临床决策提供支持。然而,传统的手动图像分割存在时间长、观察者间差异大等问题。为此,研究人员积极开发新的分割算法,如基于 AI/ML 的弱监督分割方法,在脑肿瘤、肝脏、胰腺等器官的分割中取得了较好的效果,提高了分割的准确性和效率。
  • 放射组学在预测免疫治疗结果等方面的应用:研究人员运用统计和 ML 方法,结合基线 CT 成像和 H&E 染色 WSIs 的 AI 分析,开发了多种预测模型。例如,通过构建放射组学模型预测非小细胞肺癌(NSCLC)患者的 TIL 密度,发现高预测 TIL 密度与更长的无进展生存期(PFS)相关。放射组学还被用于预测免疫治疗的疗效、总生存期(OS)和肿瘤突变负荷(TMB)等。部分研究表明,基于 AI/ML 的放射组学分析在癌症诊断和分期方面的性能优于医生,且结合多模态数据的模型能进一步提高预测准确性,但这些结果仍需在更大的患者队列中进行验证。

3.1.3 分子医学


  • 基因组分析中的挑战与 AI/ML 的应用:在利用下一代测序(NGS)技术进行基因组分析时,分子改变注释和变异检测存在误差,传统的基于 ML 模型的变异检测工具准确性欠佳。而 CNNs 在变异检测中的应用取得了突破,如 DeepVariant 在 FDA 管理的变异检测挑战中表现优异,在短读长和长读长测序技术上均能良好运行,且具有较好的通用性。
  • AI/ML 在分析其他组学数据中的作用:AI/ML 工具还用于分析大规模表观基因组数据集,识别与特定肿瘤类型相关的模式,有助于早期检测、准确诊断和预测患者预后。在蛋白质组学领域,AI/ML 可用于分析蛋白质测量技术的输出结果,构建蛋白质相互作用网络,为个性化治疗提供依据。

3.1.4 综合(多模态)分析


大多数 AI/ML 在精准肿瘤学中的应用仅针对单一数据模态,而临床实践中肿瘤学家需要整合多种数据进行患者评估。因此,模态转换和多模态分析成为研究重点。研究人员开发了多种多模态模型,如结合临床、病理、放射组学和基因组特征的模型,用于预测 NSCLC 患者对 PD-L1 阻断治疗的反应,结果显示该模型比单一模态或线性组合的模态能更好地预测客观反应,提高了预后分类的成功率。同时,研究还采用了 Prototypical Information Bottlenecking 和 Disentangling 等框架处理多模态数据的冗余问题,提升了癌症生存预测的准确性。

3.1.5 大型语言模型和生成式 AI


LLMs 在自然语言处理领域的进展为肿瘤学带来了新的应用。例如,Almanac 等 LLM 在回答临床问题时表现出色,优于未增强医学数据的其他 LLMs;Med-PaLM Multimodal 在医学问题回答、图像解释、报告生成和变异检测等任务中性能较高。LLMs 还可用于挖掘电子健康记录(EHR)中的临床相关数据,支持保险报销等。然而,LLMs 在临床应用中存在准确性和可靠性问题,如 ChatGPT 在提供治疗建议时与指南的一致性较差,且存在 “幻觉” 现象,因此目前不能直接应用于临床实践,需要进行严格的临床验证。

3.2 FDA 批准的 AI/ML 支持的医疗设备


截至 2024 年 12 月 20 日,FDA 已批准 1016 种 AI/ML 支持的医疗设备在美国上市,其中部分设备在肿瘤学领域取得了显著的临床效果。如一些设备在前列腺癌、肺癌、皮肤癌、结直肠癌等癌症的诊断、预后评估和治疗决策中发挥了重要作用,提高了检测准确性、优化了治疗方案,展现了 AI/ML 技术在临床实践中的可行性和有效性。

3.3 精准肿瘤学中 AI 部署的伦理和监管方面


  • 数据偏差:AI 模型训练数据可能存在偏差,导致医疗系统中现有的无意偏差延续,影响治疗公平性,对边缘化种族和族裔群体产生不利影响。
  • 模型透明度和信任:AI 算法的复杂性使得模型缺乏透明度,医疗专业人员对其可靠性存在疑虑。可解释 AI(XAI)方法对于建立对 AI 建议的信任至关重要,有助于提高模型的透明度和可信度。
  • 准确性和可靠性:临床决策支持系统中的 AI 预测存在不准确和不可靠的问题,在部署前需要进行严格的临床验证、标准化和真实世界测试,并持续监测模型性能。
  • 问责制:随着 AI 系统融入医疗保健,需要明确 AI 开发者、医疗服务提供者和机构的责任,建立有效的上市后监测机制,确保 AI 系统符合伦理和临床标准。
  • 数据隐私和伦理使用:AI 系统需要大量患者数据,引发了数据隐私和伦理问题,如数据的收集、存储和共享需遵循相关法规,保障患者权利。同时,各利益相关者需加强合作,推动 AI 在医疗保健领域的伦理和有效整合。

3.4 数据隐私与机构间合作


AI 在肿瘤学中的发展依赖大量多样的数据,但跨机构共享敏感患者数据面临隐私、监管和伦理挑战。联邦学习(FL)技术的出现为解决这些问题提供了方案,它允许在不共享原始患者数据的情况下进行多机构协作,通过在各机构本地训练模型并共享模型参数,既保护了患者隐私,又促进了数据的有效利用。现代平台采用标准化的临床数据协调管道,确保 FL 符合隐私法规,推动了多机构间的合作,为 AI 在肿瘤学领域的发展提供了更广阔的空间。

3.5 未来方向和新兴趋势


  • 生物传感器与 AI/ML 的结合:生物传感器可实时连续监测生理参数,与 AI/ML 结合有望为癌症的早期诊断、预后和治疗提供新的临床见解。目前,相关研究正在多种肿瘤类型中开展,但仍需在大型研究中进一步验证其有效性。
  • 可解释 AI 的发展:简单 AI 模型透明度高但准确性低,复杂模型(如 CNNs)准确性高但缺乏可解释性。XAI 旨在提高 AI 预测的透明度、可解释性和可信度,有助于揭示潜在偏差,增强模型的可信度,促进其在临床决策中的应用。

四、研究结论和讨论


AI/ML 技术在精准肿瘤学领域展现出巨大的潜力,通过分析多维数据,有助于深入理解肿瘤生物学,优化治疗选择。然而,目前该技术在实际应用中仍面临诸多挑战,如数据质量和数量问题、与现有临床工作流程的整合困难、成本较高以及专业人员对新技术的适应问题等。尽管已有许多关于 AI/ML 技术的研究发表,但由于这些挑战的存在,在肿瘤学中进行前瞻性使用该技术的临床试验较少。目前,AI/ML 技术主要应用于图像分析以识别相关特征和生物标志物,若要将 AI 作为智能 “助手” 应用于临床,还需开发相关基准以确保其在真实世界中的性能。

为推动 AI/ML 技术在精准肿瘤学中的应用,需要采取一系列措施。例如,遵循 “FAIR” 数据原则,提高数据的质量和可及性;加强各利益相关者的合作,将 AI 纳入常规保险覆盖范围,开展临床医生培训,持续评估 AI 应用的可行性和有效性;开展患者教育,提高患者对 AI 工具的信任度等。未来,AI 的进一步发展可能包括将符号化和 DL 模型相结合的神经符号 AI,融合两者优势,形成更具可解释性和高性能的技术。

总体而言,AI 驱动的决策支持工具结合患者个体特征和多组学分析,有望优化治疗策略和临床试验招募,改善患者预后,加速药物开发,推动肿瘤学治疗标准的进步。但目前的研究仍处于早期 “概念验证” 阶段,AI/ML 模型要对临床治疗标准产生积极影响,必须经过前瞻性、多中心、大样本的临床试验,以证明其临床有效性、实用性和真实世界的可用性。这一研究为精准肿瘤学的未来发展指明了方向,也为后续研究和临床实践提供了重要的参考依据。

相关新闻
生物通微信公众号
微信
新浪微博


生物通 版权所有