在脊柱肿瘤手术中,每一分钟都至关重要。外科医生需要在手术过程中快速确定肿瘤的性质,是良性的神经鞘瘤(Schwannoma)、脑膜瘤(Meningioma),还是恶性的转移瘤(Metastasis)或室管膜瘤(Ependymoma),因为不同的诊断直接决定了手术切除的范围和后续的治疗策略。然而,当前的“金标准”——术中快速冰冻切片诊断,却面临着几大难题:首先,它通常需要超过30分钟的时间,让手术团队在等待中煎熬;其次,它的诊断准确性在不同研究中报告为86.6%至88.6%,并非万无一失;更关键的是,这项技术高度依赖病理专家的现场判读,且通常只在常规工作时间提供。对于发生在深夜或周末的紧急手术,或者位于缺乏专科病理医生的医疗中心,获得快速、准确的术中诊断就成了一种奢望。有没有一种方法,能够像“拍立得”一样,在几分钟内给出可靠的诊断,且不依赖于特定专家,随时可用呢?
近期,一项发表在《npj Digital Medicine》上的研究给出了一份令人振奋的答卷。一个国际研究团队成功开发了全球首个专门用于脊柱肿瘤的AI驱动术中快速诊断系统——SpineXtract。这项研究创新性地将一种名为受激拉曼组织学(Stimulated Raman Histology, SRH)的无标记光学成像技术,与前沿的深度学习模型相结合,旨在破解脊柱肿瘤术中诊断的时效性与准确性困局。SRH技术无需对组织进行复杂的化学固定或染色,就能在几分钟内生成类似苏木精-伊红(H&E)染色的高分辨率虚拟图像。研究人员正是以此为基础,构建了SpineXtract系统。
为了开展这项研究,研究人员主要应用了几项关键技术。首先是SRH成像技术,利用便携式光纤激光成像系统对新鲜、未处理的脊柱肿瘤标本进行快速扫描,生成虚拟H&E样图像。其次是人工智能模型开发,采用基于BYOL框架的自监督学习方法训练视觉基础编码器,并创新性地引入了基于Transformer的注意力机制分类器,专门针对四种常见脊柱肿瘤类型(脑膜瘤、神经鞘瘤、室管膜瘤、转移瘤)进行优化。此外,研究采用了国际多中心模拟单臂试验设计,利用来自纽约大学(NYU)、密歇根大学(UM)和维也纳医科大学(MUV)三个机构的现有SRH数据集(44名患者,142张切片图像)进行模型验证,并以最终病理诊断为金标准。研究还包含了模型可视化与解释技术,生成可解释的热图叠加和置信度评分,为外科医生提供直观的术中反馈。
研究结果
SpineXtract的开发和多中心测试
研究人员开发了SpineXtract平台,其工作流程始于术中获得新鲜组织标本,经SRH成像仪快速成像后,由AI模型进行分析。该系统整合了自监督学习框架构建的视觉编码器、基于Transformer的块分类机制以及生成可视化热图的语义概率分割方法。在国际多中心测试中,该系统在44名患者的142张SRH图像上进行了验证。
诊断性能:国际多中心模拟单臂临床试验
在患者层面,SpineXtract实现了92.9%的宏观平均平衡准确度(95% CI: 85.5–98.2),宏观AUROC(受试者工作特征曲线下面积)为98.0%。即使在最苛刻的条件下(每名患者仅随机使用一张SRH图像进行分析),其平衡准确度仍保持在93.7%。在切片层面,宏观平均平衡准确度也达到了92.4%。
实体特异性性能分析表现出跨肿瘤类型的差异
具体到每种肿瘤,SpineXtract的表现略有不同:对神经鞘瘤和脑膜瘤的诊断近乎完美,平衡准确度分别达到98.5%和98.6%;对转移瘤的诊断也表现出色,平衡准确度为90.5%;最具挑战性的是室管膜瘤,其平衡准确度为84.1%,但特异性仍为100%,意味着虽然可能漏诊,但一旦诊断为室管膜瘤则非常可靠。
模型判别、校准和临床置信度阈值
校准分析显示模型输出的概率具有良好的校准性。研究人员还推导出一个经验性置信度阈值(τ = 0.77),用于识别低置信度预测,从而在临床部署中触发重复成像或专家复审,保障安全。
跨机构和人口统计学分层性能分析
在不同医疗机构(NYU, UM, MUV)和不同性别、年龄的患者亚组中,SpineXtract均表现出稳定且一致的诊断性能,宏观平均平衡准确度在91.4%至92.0%之间,证明了其良好的泛化能力。
工作流程计时
在代表性工作流程评估中,从获取组织标本到获得AI预测结果的总时间约为5分钟,包括组织获取(30-60秒)、SRH图像生成(约3分钟)和AI推理与可视化(约1分钟)。
与先进的SRH-CNS分类器在脊柱肿瘤诊断中的比较
与现有的、为颅内中枢神经系统(CNS)肿瘤设计的SRH分类器相比,SpineXtract展现了显著优势。在包含36名患者的子集上,SpineXtract的平均平衡准确度(92.3%)比SRH-CNS分类器(76.7%)高出15.6个百分点。尤其在诊断脊柱室管膜瘤和转移瘤方面,SpineXtract的改进最为明显,这凸显了针对特定解剖部位(脊柱)开发专用AI算法的必要性。
肿瘤块数量对SpineXtract分类性能的影响
分析发现,诊断性肿瘤块的数量与分类准确性显著相关。正确预测的案例平均使用189.4个图像块,而错误预测的案例平均仅使用103.7个图像块。每个额外的图像块可将正确预测的几率提高0.533%。这一关系在室管膜瘤中最为突出,表明对于组织学异质性较高的肿瘤,更大的样本量有助于提高诊断信心。
研究结论与讨论
本研究成功开发了SpineXtract,这是首个专门为脊柱肿瘤设计的、基于SRH的AI分类器。该系统将自监督学习与改进的自注意力(Self-Attention)模块相结合,不仅显著优于现有的颅内SRH-CNS肿瘤分类器,也证明了其改进的自注意力机制是实现高准确度的关键。通过生成彩色编码热图并结合置信度评分,系统为外科医生和病理医生提供了直观的术中视觉反馈。
其临床意义在复杂脊柱病例中尤为突出。尽管影像学不断进步,脊柱肿瘤仍常因不典型的影像特征而被误分类,明确诊断始终依赖组织病理学检查。SpineXtract能在约5分钟内为外科医生提供诊断,同时保持超过92%的准确度,优于文献报道的传统冰冻切片分析(86.6-88.6%)。更重要的是,它不依赖于病理学家的工作时间,能够提供近乎实时的、人类审阅者独立的诊断决策支持。
研究首次证明,现有的颅内SRH-CNS肿瘤分类器不能可靠地应用于脊柱轴线的对应肿瘤。SpineXtract通过针对脊柱肿瘤特有的组织形态学特征(如脊柱室管膜瘤的异质性、脊柱转移瘤的原发癌谱差异等)进行专门训练,填补了这一解剖部位特异的空白。例如,SpineXtract能够正确分类在训练中未见的罕见脊柱肿瘤亚型(如透明细胞脑膜瘤、尤文肉瘤转移),展现了零样本泛化能力,这在术前影像和术中宏观观察均无法明确诊断的疑难病例中具有重要价值。
此外,研究中建立的置信度阈值机制和校准后的概率输出,确保了模型预测的可解释性和临床决策的安全性,符合负责任的临床AI实施原则。
总之,SpineXtract作为第一个利用改进自注意力机制处理脊柱肿瘤组织形态异质性的数字病理学分类器,在国际多中心验证中展现了高准确性,并能够无缝集成到手术工作流程中,在5分钟内提供可靠诊断。这项研究标志着脊柱肿瘤术中诊断向快速、精准、自动化的方向迈出了关键一步,有望显著提升诊疗效率,改善患者预后。未来的研究方向包括纳入更罕见的脊柱肿瘤类型(如星形细胞瘤、淋巴瘤),在社区医疗环境中进行外部验证,以及探索与数字化H&E及免疫组化数据的多模态整合。