综述:人工智能在肾移植病理学中的应用:当前证据、局限性及与Banff框架的相关性

时间:2026年5月28日
来源:Kidney International Reports

编辑推荐:

Banff分类于1991年建立,为诊断和分级肾移植病理学提供了全球标准,通过定期共识会议不断演进以纳入新进展。最初旨在解决肾移植活检报告缺乏统一性的问题,Banff系统现在整合了急性病变和慢性病变的半定量评分。近年来,人工智能(AI)和深度学习(DL)的进展加

广告
   X   

Banff分类于1991年建立,为诊断和分级肾移植病理学提供了全球标准,通过定期共识会议不断演进以纳入新进展。最初旨在解决肾移植活检报告缺乏统一性的问题,Banff系统现在整合了急性病变和慢性病变的半定量评分。近年来,人工智能(AI)和深度学习(DL)的进展加速了肾组织学定量分析,特别是针对间质纤维化/小管萎缩(IFTA)和炎症,减少了观察者间差异并支持预后评估。针对性的算法如阳性像素计数和基于DL的分割模型在识别肾区室和量化损伤方面表现出稳健性能,而针对血管病变和免疫细胞谱的AI辅助方法显示出潜力,但在数据多样性、染色标准化和外部验证方面存在局限。此外,研究人员还探索了其他指标,如肾单位大小、IFTA病灶密度和系膜扩张,计算指标和AI模型在提高可重复性和临床相关性方面显示出潜力。尽管对AI在病理学中影响存在担忧,但对其增强人类专业知识和提高诊断精确性的能力持乐观态度。Banff数字病理学工作组的持续工作旨在将自动化评估扩展到额外的Banff病变,包括肾小球肾炎、管周毛细血管炎、动脉炎和小管炎。随着这些工具的成熟,它们可能实现对移植活检更全面的定量表征,并促进探索难以研究的组织病理学模式。Banff系统的迭代演进和拥抱AI驱动的数字病理学强调了其在肾移植医学中的持久影响和前景。
**引言**
肾移植活检评估仍是诊断移植物损伤和指导患者管理的基石。组织病理学解释目前由Banff分类(Banff Classification)构建,该分类提供了一个结构化框架,具有标准化的病变定义和诊断类别。尽管被广泛采用,但多个Banff病变评分依赖于半定量视觉评估,因此存在显著的观察者间差异和有限的重复性。活检量增加、人力短缺和诊断复杂性增加凸显了对更客观、可扩展方法的需求。这些挑战刺激了对计算方法的兴趣。数字病理学的日益普及为应用人工智能(AI)于肾移植组织学创造了新机遇。过去十年,众多研究开发了算法来识别肾区室、量化纤维化、检测炎症细胞并测量与移植物结局相关的形态特征。然而,这些工作在范围、数据集大小和方法学设计上差异很大,且很少有研究验证用于常规临床应用。本综述总结当前AI在肾移植病理学中的应用及其与Banff框架的关系。研究人员并非提出新的评分系统或指南,而是总结文献、突出方法学挑战,并讨论计算病理学可能补充Banff分类未来发展的领域。

**Banff分类:概述**
Banff分类(Banff Classification)由Kim Solez和Lorraine C. Racusen于1991年在加拿大艾伯塔省班夫举行的首次共识会议上建立,提供了肾移植活检组织病理学评估的国际标准。Banff分类依赖于对移植肾主要组织区室(包括肾小球、小管间质、管周毛细血管和动脉)的系统性评估。在这些区室中,反映炎症损伤或慢性瘢痕的特定病变根据其严重程度进行半定量评估和分级。在当前Banff框架中,定义了17个病变评分,每个评分在从无到严重累及的序数量表上分类。这些评分的组合随后用于诊断和分级主要的移植物损伤类别,包括T细胞介导的排斥反应(T cell–mediated rejection)、抗体介导的排斥反应(antibody-mediated rejection)和慢性移植物损伤(chronic allograft injury)。自1993年首次发表以来,该分类通过Banff移植物病理学基金会(Banff Foundation for Allograft Pathology)组织的每两年一次的共识会议定期更新。这些更新细化了病变定义,并纳入了将组织学特征与临床结局联系起来的新证据。最近一次会议于2024年在巴黎举行。该分类在全球使用超过34年,展示了共识会议和流程在医学亚专业领域中的实用性。2018年,一份带有每个Banff病变图例的详细用户指南在《Transplantation》杂志上发表。

尽管具有优势,但多个Banff评分依赖于视觉估计,且观察者间一致性中等,特别是对于炎症和微血管病变。这些局限性促使了对数字病理学和计算方法的兴趣,这些方法可以提供更标准化的定量测量。

**AI在肾移植病理学中的发展概述**
随着组织学切片的数字化,应用于肾移植病理学的人工智能方法迅速扩展。大多数研究依赖于深度学习模型,特别是卷积神经网络(convolutional neural networks, CNNs),训练用于分析全切片图像(whole-slide images)。过碘酸-希夫染色(Periodic acid–Schiff, PAS)是最常用的基质,其次是银染(如Jones乌洛托品银)、三色染色(如Masson)、苏木精-伊红(Hematoxylin and Eosin, H&E)和各种免疫组织化学标记物,如CD45、CD34、CD3和C4d。

**3.1 AI用于全球肾小球硬化**
全球肾小球硬化(global glomerulosclerosis),尽管没有特定的Banff评分,但由于其预后意义,在肾移植病理学中常规报告,特别是在供体评估中。因此,量化硬化肾小球是计算病理学的早期目标之一。Marsh等人开发了最早的模型之一,用于在冷冻切片中区分正常和全球硬化的肾小球,以支持植入前活检评估。后续验证显示模型与病理学家之间的性能相当。

随着深度学习的出现,多类分割模型实现了多个肾区室的同步识别。在最早的研究之一中,Hermsen等人报告了全球硬化肾小球的Dice系数仅为0.62,这受限于训练集中标注样本数量较少。后来使用更大数据集的研究显示了性能提升。例如,一个包含1366个标注硬化肾小球的258例尸体供体活检队列产生了显著更高的Dice分数。随后的几个DL模型在不同平台和染色协议中实现了90–98%的F1分数,反映了在分割全球硬化肾小球方面的强劲性能。

总体而言,全球肾小球硬化的自动量化是肾移植病理学中较成熟的AI应用之一。

**3.2 AI用于小管间质病理(间质纤维化和小管萎缩)**
间质纤维化(interstitial fibrosis, IF)和小管萎缩(tubular atrophy, TA),在Banff分类中分别评分为ci和ct,构成了慢性组织损伤的关键标志物,并常用作临床研究中的替代终点。然而,传统的视觉评分受观察者间差异和半定量估计性质的限制。为解决这些局限性,开发了传统图像分析工具和基于DL的方法来量化小管间质瘢痕的程度。早期的计算方法依赖于“针对性”的基于规则的算法,而最近的研究则应用了多类DL分割模型于PAS、三色和H&E染色的全切片图像。纤维化评估最早的计算方法之一是阳性像素计数(Positive Pixel Count, PPC)算法。PPC根据预定义的色相和饱和度参数评估颜色定义的阈值,将图像像素分类为“阳性”或“阴性”,从而计算选定区域内纤维化组织的比例。这些方法在突出细胞外基质成分的组织化学染色(如天狼星红、Masson三色和胶原特异性免疫组织化学)上表现最佳。

最近,基于深度学习的方法通过自动分割肾区室,实现了对小管间质损伤更详细的评估。2019年,第一个在PAS染色移植活检上训练的多类分割模型,对IFTA实现了0.80–0.84的加权平均Dice系数,并显示了与病理学家推导的真实值的强一致性。随后在NEPTUNE联盟的工作评估了跨三色、PAS、H&E和银染的多种DL架构,显示PAS染色全切片图像在所有结构中产生了最高的分割准确性。分割输出实现了定量小管间质特征的提取,改善了局灶节段性肾小球硬化和微小病变等疾病的预后评估。其他研究使用深度学习量化了间质扩张、小管萎缩、小管扩张和肾小球大小变异性。更近期的工作显示了染色无关的性能,表明更广泛的临床适用性。在一个多类分割模型中,观察到肾硬化症与肾单位大小之间的负相关。此外,基于AI测量的慢性度评分在预测肾衰竭方面表现出优异性能。

其他小组使用卷积神经网络(CNNs)如DeepLab version 2来量化纤维化、小管萎缩和肾小球硬化。深度学习模型也被应用于为肾活检分配Banff评分,包括ci和ct,以及Banff小管炎(t)和肾小球硬化,显示出与病理学家的一致性。在另一项研究中,深度学习方法同步量化了小管萎缩和肾小球硬化,Dice分数分别为0.9174和0.9529。基于AI的纤维化量化也与临床结局相关。Kolachalama等人证明,使用GoogLeNet Inception架构深度学习检测的间质纤维化与肾脏存活率相关。使用从深度学习特征导出的复合小管间质损伤评分也显示了与肾脏结局的功能相关性。

这些AI方法共同说明了AI生成连续、可重复的小管间质损伤测量值的潜力,可能补充传统的Banff评分。

**3.3 AI用于血管病变**
血管病变是评估肾移植活检的核心,反映了广泛的移植物损伤机制。在Banff分类中,十五个病变评分中有七个与动脉或微血管损伤相关,包括内膜动脉炎(v)、血管纤维性内膜增厚(cv)、动脉或小动脉玻璃样变(ah, aah)、肾小球肾炎(g)和慢性肾小球病变(cg)。间质微血管损伤由管周毛细血管炎(ptc)和C4d染色捕获。这些特征不仅对于诊断和分级T细胞介导和抗体介导的排斥反应至关重要,也可能反映非排斥原因导致的移植物功能障碍,如慢性高血压或供体源性血管疾病、钙调神经抑制剂相关小动脉病变、糖尿病血管病变和血栓性微血管病。鉴于这些多样化的病因,血管病变具有重要的诊断和预后价值,多项研究显示了血管损伤严重程度与移植物存活之间的强关联。

早期肾移植病理学中的深度学习研究在更广泛的多类分割框架中包含了血管结构。Hermsen等人描述的模型中,动脉与其他肾结构相比分割准确性较低,且未报告血管病变的下游分析,可能反映了有限的性能。随后在原肾疾病中的工作将分割扩展到包括跨多种染色的ptc、动脉和小动脉,展示了微血管识别的可行性,尽管性能仍可变。一项后续研究应用了Jayapandian等人先前训练的模型来分析280例PAS染色数字化肾活检中的ptc形态,这些活检来自微小病变、局灶节段性肾小球硬化、膜性肾病和IgA肾病。ptc的形状与这些原肾活检中的疾病进展相关。该研究提供了概念验证,即计算工具可以从标准组织学染色中提取生物学意义的微血管信息。其他工作利用深度学习评估了间质炎症和管周毛细血管炎,显示了与病理学家评分的中等一致性。一项更近期的研究,使用69例PAS染色并复染内皮标记物CD34的肾移植活检来训练深度学习模型进行ptc分割。尽管模型性能满意,但在间质炎症、纤维化和小管萎缩突出的区域观察到挑战。该研究利用免疫组织化学标记物生成真实值标注,阐明了一种可能提高对常规染色上定义不佳的微血管结构准确性的策略。

C4d染色量化是诊断抗体介导排斥反应(ABMR)的重要组成部分。使用380例C4d免疫组织化学染色开发的深度学习系统(使用CNN)检测了C4d阳性和阴性ptc。该系统被提议为可靠且高效,尽管是在单一中心数据集上开发的。在验证研究中,使用来自两个中心、由两个不同扫描仪扫描并由三位病理学家评估的186张切片,该系统与病理学家具有可比性能,从而支持了该工具的可靠性。另一项研究使用阳性像素计数算法量化了34例单中心肾移植活检中间质(和肾小球)的C4d阳性像素,显示比两位病理学家评分更高的重复性。鉴于AI工具在癌症病理学中免疫组织化学生物标志物分析方面的进展,预计C4d分析的新模型将出现。

尽管取得了这些进展,但针对其他关键血管病变(包括肾小球肾炎、慢性肾小球病变和内膜动脉炎)的计算工具尚不可用。这些差距突显了对模型开发、改进标注策略以及可能整合分子标记以增强微血管损伤检测的持续需求。

**3.4 AI用于炎症病变**
炎症是肾移植排斥反应的核心特征,也是移植物结局的主要决定因素。在Banff分类中,多个病变评分捕获了不同分布的炎症浸润,包括间质炎症(i)、总皮质炎症(ti)和间质纤维化/小管萎缩区内的炎症(i-IFTA)。这些评分为T细胞介导和抗体介导排斥反应的诊断和分级提供贡献。尽管具有临床重要性,但炎症评分的评估高度主观。即使在经验丰富的肾病理学家之间,炎症评分的观察者间一致性仍然相当有限(κ=0.32–0.50),反映了视觉估计细胞密度、区分炎症细胞与驻留组织元素以及识别纤维化或结构改变区域炎症的挑战。此外,传统的Banff评分不区分免疫细胞亚型,尽管炎症浸润的组成(如巨噬细胞、自然杀伤细胞或T细胞亚群的相对丰度)为排斥反应机制和后续移植物功能障碍风险提供了重要见解。例如,富含巨噬细胞的浸润与更严重的排斥表型和较差的长期功能相关,而自然杀伤细胞和巨噬细胞的密度在抗体介导排斥反应中特别升高。通过免疫组织化学或多重免疫荧光进行的人工免疫细胞量化是劳动密集型、耗时且受观察者内和观察者间变异的影响,限制了其在常规诊断中的适用性。因此,开发了计算和基于AI的方法以提高炎症的重复性、粒度和生物学特异性。

早期的计算方法展示了使用颜色图像分析和形态测量技术自动检测炎症的可行性。最近的DL架构——尤其是CNNs——通过直接分析全切片图像以识别组织结构和量化免疫浸润,显著推进了这一领域。例如,Yi等人开发了一个在PAS染色活检上训练的CNN,以识别组织区室和检测单核白细胞。使用1140例具有临床随访的活检,作者整合了多种组织学特征,包括间质异常、小管密度和炎症细胞负担,形成一个预测长期移植物功能和存活的复合损伤评分。这项工作的一个关键优势是依赖于常规PAS染色,支持广泛的临床适用性。然而,其真实值基于病理学家手动标注而非免疫组织化学标记,可能引入对炎症细胞类型精确识别的不确定性。Jacq等人在三色染色切片上使用基于U-Net的模型量化总间质炎症和管周毛细血管炎。他们的方法在没有复染或多重免疫标记的情况下实现了与Banff评分的高一致性,强调了DL基于常规组织学进行炎症评分的可行性。然而,依赖三色染色——一种在肾移植诊断中并非普遍采用的方案——可能限制在主要使用PAS或H&E评估排斥反应的中心的直接实施。经典图像分析结合IHC也显示出实用性。Smith等人使用CD45免疫染色切片结合经典图像分析来量化整个皮质的炎症细胞密度,与Banff ti评分显示出强相关性(r=0.82),证明了更简单的自动化管道如何增强客观性。Hermsen等人同样针对炎症和慢性病变,但整合了基于CD3的淋巴细胞检测和基于PAS的结构分割。该小组利用多重酪胺信号放大和DL来分析早期监测活检中的免疫细胞表型。Suzuki等人,尽管非移植特异性,使用双网络(深度学习肾分割(DLRS)-组织和DLRS-细胞核)将方法扩展到更广泛的慢性肾脏疾病,以量化纤维化和炎症浸润。两项研究都提供了纤维化和非纤维化区域内炎症的首次连续、定量估计——反映了Banff i-IFTA概念。

计算组织病理学的一个趋势是使用多网络架构,这也在炎症病变评估模型中得到反映。这些系统整合组织分割、细胞检测和空间分析,以生成生物学可解释的测量值。Yi等人将基于U-Net的组织分割与Mask R-CNN细胞检测相结合,以量化PAS染色活检上的炎症负担,而Jacq等人在三色切片上使用单个CNN识别白细胞和管周毛细血管。其他方法使用级联或并行网络:Suzuki等人应用级联CNNs进行结构和细胞核分割,而Hermsen等人部署并行CNNs进行组织分割和CD3+淋巴细胞检测。这些方法提供了连续且空间解析的炎症测量,超越了传统的半定量评分。然而,方法学差异继续影响性能和泛化能力。研究在标注策略上存在差异,从病理学家手动标注到多重免疫表型分析,以及数据集大小和验证设计,大多数模型在相对较小的单中心队列上开发,且仅有有限的外部验证。

深度学习模型用于炎症病变评估的报告性能通常很强,与专家评分有显著一致性。例如,对于i、ti和ptc,报告了0.6–0.8的κ系数。值得注意的是,一些研究报告了与手动评估相比降低了观察者间变异性。

除了与病理学家评分的一致性外,几个模型已证明了预后相关性。Yi等人开发的复合损伤评分预测了超越临床变量和Banff评分的移植物丢失,而Suzuki等人显示DL衍生的炎症和纤维化指标与肾功能变化的相关性比视觉估计更密切。Hermsen等人提供了不同的贡献,证明应用于多重IHC的DL可以解析与早期IFTA发展相关的免疫亚群和空间模式。

这些研究共同表明,基于AI的工具可以比视觉评分更一致地量化炎症病变,并可能提供生物学更丰富的信息,特别是当与免疫表型分析或空间解析成像结合时。

**3.5 超越Banff:AI实现的定量组织学**
人工智能越来越多地被用于量化更广泛肾脏疾病中的组织学特征。这些方法能够对难以视觉评估的结构特征进行客观、可重复的测量,并可能提供对组织损伤和疾病进展的额外见解。

**3.5.1 肾单位大小**
肾单位大小(nephron size),包括肾小球体积和小管横截面积,未包含在Banff分类中,但在原肾和移植肾疾病中显示出预后意义。病理学家通常注意增大——如“肾小球肥大”或小管扩张——当它显著时,但常规视觉估计不足以进行精确量化。形态测量分析显示,植入活检中较大的肾小球体积和小管横截面积与移植受者的后续移植物丢失相关。然而,一项针对5年监测受者活检的研究显示,较小的肾小球与死亡删失移植物丢失相关,这是由于较小、缺血外观肾小球的比例较高。因为活检上的小管轮廓可能具有不同的曲率、方向和形状,另一项研究单独观察了近端和远端小管的小管直径(短轴),发现仅较浅表远端小管的扩大与根治性肾切除术患者进行性CKD独立相关。

手动形态测量尽管有信息量,但劳动密集且不切实际用于常规实践。最近,开发了两种基于AI的方法,允许量化肾单位大小并证明其与未来肾功能结局相关性的重要性。一项研究应用了公开可用的NEPTUNE分割模型到根治性肾切除术标本的楔形切片,发现AI衍生的肾小球测量反映了与疾病进展相同的手动评估关联。第二项研究量化了肾移植供体植入活检和RN患者楔形切片中的肾小球体积以及分别近端和远端小管的平均横截面积。在供体中,经调整分析,较大的近端小管与短期eGFR降低相关,但较大的肾小球与长期(中位数术后10年)eGFR降低相关。在RN患者中,较大的肾小球以及较大的近端和远端小管均与进行性CKD和肾衰竭相关。未来需要基于AI的研究来评估肾移植活检中的肾小球体积和小管面积及其与移植物存活的关联。这些发现表明,基于AI的肾单位大小量化可能在肾移植活检中提供临床相关指标。

**3.5.2 IFTA病灶密度和缺血外观肾小球百分比**
最近的研究引入了额外的定量组织学特征——特别是IFTA病灶密度和缺血外观肾小球的比例——这些未被Banff评分捕获,但显示出预后价值。IFTA病灶密度计算为不同纤维化或萎缩区域的数量除以皮质面积。在三个独立队列中(涉及根治性肾切除术患者、原肾疾病患者和肾移植受者),较高的IFTA病灶密度与CKD进展、终末期肾病或移植物丢失风险增加相关。IFTA病灶密度可以从所有IFTA病灶的数量除以皮质面积计算。存在许多小的IFTA病灶可能反映更弥漫的慢性损伤过程和更高的肾功能下降风险。基于AI的方法最近被应用于量化小管萎缩病灶密度,证实了早期在肾切除术标本中的形态测量观察,并支持自动化评估的潜力。

缺血外观肾小球(ischemic-appearing glomeruli)——以肾小球囊周围纤维化和毛细血管环皱缩为特征——是另一个感兴趣的组织学特征。目前对其报告没有共识,其临床相关性最近才被评估。在一项针对5年监测移植活检的研究中,较高比例的缺血外观肾小球与死亡删失移植物丢失独立相关,而全球硬化肾小球的比例则没有。有趣的是,缺血外观肾小球的影响似乎如此之强,以至于在包含所有Banff评分的模型中,Banff ci评分与移植物丢失的关联被消除。如前所述,几项已发表的研究证明了AI对全球硬化肾小球的出色量化,但据研究人员所知,仅有一项研究训练了模型来分割植入前肾活检中的缺血外观肾小球。需要额外的基于AI的模型来跨移植队列验证这些发现,并确定缺血外观肾小球是否应纳入未来的病理报告框架。

**3.5.3 系膜扩张**
系膜扩张(mesangial expansion, ME)目前评分为Banff mm评分,基于具有至少中度ME的肾小球比例。通常,ME与糖尿病肾病相关。该评分的主要限制因素是人际重复性差,因为每个读者可能对中度ME有不同的阈值或定义。为解决这些局限性,已应用形态测量方法来评估移植活检中的ME。两项最近分析5年监测活检的研究表明,系膜基质的定量形态测量与未来移植物丢失独立相关。一项研究得出结论,Banff mm评分低估了晚期活检中ME的普遍性,表明更精细或连续的测量可能更好地捕获临床相关变异。基于AI的技术提供了潜在解决方案,但在这一领域仍不成熟。最早且最接近的努力之一是Ginley等人引入的用于糖尿病肾病肾小球病变分类的计算框架。他们的模型使用区室内距离特征来量化系膜基质扩张,并区分具有显著系膜增厚或Kimmelstiel-Wilson结节的肾小球与具有轻度变化的肾小球。尽管在糖尿病肾病背景下开发,但这种方法说明了定量、连续指标如何改善移植病理学中的ME评估。需要进一步的AI驱动工作来开发和验证专门用于肾移植活检的ME量化工具。

**AI在肾移植病理学中的挑战**
尽管方法学进展迅速,但几个挑战限制了AI模型向常规临床实践的转化。一个主要限制是大型、多样化且标注良好的数据集的可用性。大多数已发表的研究基于单中心队列,样本量有限,增加了过拟合风险并降低了泛化能力。染色协议、扫描仪类型和图像采集的差异进一步导致数据集异质性,并可能导致模型跨机构应用时性能下降。类别不平衡和某些病变(如内膜动脉炎)的局灶性质进一步使模型开发复杂化。罕见但临床重要的病变在训练数据集中通常代表性不足,限制了检测性能。例如,动脉和小动脉在核心针活检中通常采样稀疏,限制了算法开发可用的训练数据量。当存在时,血管可能被斜切或切向切片,使内膜增厚或其他形态变化的评估复杂化。内膜动脉炎等病变可能高度局灶,仅发生在动脉的单一段内,进一步挑战了自动检测。相比之下,管周毛细血管丰富但引入了额外的复杂性。它们是小的、通常在间质中不清晰的管腔空间,其在密集炎症或纤维化区域的可见性可能显著降低。因此,准确标注这些结构具有挑战性,需要病理学家专家的大量输入。在计算分析中,这转化为高标注负担,因为需要大量精确标记的样本来训练稳健的深度学习模型。高质量标注,特别是在细胞或微血管水平,对于难以在常规染色上勾画的结构(如管周毛细血管和炎症细胞)尤为重要。此外,真实值定义本身也造成障碍,因为许多模型依赖于病理学家标注,而病理学家标注受观察者间变异影响,特别是对于半定量Banff评分。这种变异性传播到训练过程中,并使模型性能解释复杂化。

重要的是,AI模型可能无意中学习观察者或机构特定的评分倾向,而非纯粹的生物学模式,从而限制了跨中心的泛化能力。此外,不一致的标注可能对模型性能施加上限,特别是对于专家病理学家之间重复性仅中等的病变。因此,已经提出了几种策略来提高标注稳健性,包括共识评分、专家小组仲裁、多观察者标注和基于读者研究的验证框架。此外,一些研究越来越多地纳入正交参考标准,如免疫组织化学或分子标记,以生成更基于生物学的真实值标注,用于炎症或微血管病变。

除了改进组织学标注一致性本身,未来AI在肾移植病理学中的发展可能转向多模态端到端学习框架,该框架将联合整合全切片图像衍生的深度学习嵌入与临床参数、供体特异性抗体状态、纵向移植物结局和分子多组学数据,从而实现超越传统半定量组织学评分系统的生物学和预后信息丰富的组织表征。

最后,临床实施提出了额外的考虑因素,包括模型输出的可解释性、集成到现有诊断工作流程、监管批准和医疗法律责任。解决这些挑战需要协调努力,实现多中心数据共享、标准化标注协议和严格的外部验证。

**未来方向**
尽管在开发肾移植病理学AI方面取得了实质性进展,但在这些方法能够转化为常规临床实践之前,仍存在几个重要挑战。目前,许多模型仍处于概念验证阶段,需要进一步工作以提高泛化能力、扩展对代表性不足病变类型的覆盖并证明临床实用性。

在血管病理学中,尽管微血管损伤具有诊断重要性,但计算方法仍然有限。使用免疫组织化学复染,如CD34作为内皮标记物和CD45作为白细胞标记物,为增强管周毛细血管和浸润性炎症细胞的可见性和勾画提供了机会。将这些标记物整合到标注管道中可能改善在常规染色上难以识别的结构的分割准确性。多重成像技术的进步进一步扩展了这些可能性。多重免疫荧光允许在单个组织切片上同时可视化多个细胞和结构标记物,从而允许对血管成分、免疫细胞群及其空间关系进行更精确的表征。最近的研究表明,DL可以量化肾移植活检中多重成像衍生的特征,这表明了前进的道路,以实现更详细和可重复的微血管损伤评估。新兴领域如异种移植引入了独特的血管表型,可能需要专门的计算模型。随着这些领域的发展,将高分辨率成像、免疫表型分析和空间背景与AI驱动分析相结合,对于改善临床和研究环境中血管病变的检测、量化和解释至关重要。

类似的考虑适用于炎症病变评估。尽管当前的深度学习方法可以以合理的一致性量化总体炎症负担与病理学家评分,但大多数模型尚未区分与理解排斥机制相关的免疫细胞亚型。此外,许多方法依赖于染色特定模型或需要组织化学和免疫组织化学切片之间的配准,限制了可扩展性。增加训练数据多样性、改进跨中心和扫描仪类型的外部验证以及整合免疫表型分析方法代表了重要的下一步。协作倡议,包括DIAGGRAFT、MONKEY挑战和其他大型标注数据集,旨在解决这些局限性并支持开发更通用的模型。

AI不太可能取代Banff分类,而是可能通过提供定量和可重复的测量来补充它。当前发展展示了自动区室分割和量化纤维化和炎症负担等特征的可行性,这些是Banff病变评分的核心。这些能力表明AI在改善病变评估一致性方面可能发挥作用,特别是对于难以视觉估计且具有中等/高观察者间变异性的特征。连续定量输出可能通过捕获组织损伤的更细微变化,为序数Banff评分系统提供补充信息。

除了诊断支持外,基于AI的方法可能促进队列间组织学特征的大规模标准化分析,从而支持旨在改进现有分类系统和识别新型生物标志物的研究。然而,临床实施需要严格的验证和集成到诊断工作流程中。因此,未来研究应不仅关注技术性能,还应关注临床影响和实施。

**AI关注与乐观**
作为Banff分类的联合创始人和移植病理学领域的长期贡献者,Kim Solez博士经常强调新兴技术对病理学的更广泛概念性影响。以下观点突出了人工智能在肾移植病理学中的担忧和机遇。

一个可能的担忧是,诸如免疫耐受和再生医学等新兴发展可能代表了移植未来的竞争轨迹。然而,AI的进步可能促进两个领域的进展,这些技术可能以互补的方式相互作用,加速移植医学的创新,并可能有助于长期解决器官短缺问题。另一个经常讨论的担忧是AI可能削弱人类创造力。然而,AI也可能反而扩大人类创造力和表达的机会。例如,由王清音创作的图形《金的构成成分:技术/医学/诗歌/音乐/未来》(补充图)展示了一种当代AI训练数据集不可用的个人人类创造力形式。类似地,一些观点认为未来的AI系统可能对人类决策产生越来越大的影响。另一些人则认为AI可能越来越多地塑造技术基础设施,但人类将保留决定这些系统如何应用于社会和科学研究的自主权。从这个角度看,AI可能扩大而非限制科学探索的机会。在资源有限的环境中,研究人员通常受时间、人力和可用基础设施的限制。相比之下,新兴AI系统,包括自主“AI代理”,最终可能使研究人员能够探索更广泛的假设和分析方法,可能将研究的某些方面从稀缺范式转变为计算丰富。

**结论**
过去十年,众多计算方法——包括传统图像分析技术和深度学习模型——已被开发用于量化原肾、供体和移植肾组织中的多种组织学特征。尽管基于AI的方法在分析肾移植组织学方面显示出相当大的潜力,但它们在很大程度上仍是一种研究工具,处于概念验证阶段。在开发综合AI模型或完全自动化大多数(如果不是全部)Banff评分的模型方面,研究人员还有很长的路要走。许多模型使用有限的、单中心的数据集开发,训练数据在中心之间分散,且模型通常依赖于特定的染色协议或图像采集设置,限制了泛化能力。跨机构、扫描仪类型和人群的严格外部验证仍然罕见,凸显了对更协作、多中心努力的需求。此外,几个重要的Banff病变,包括肾小球肾炎、移植肾小球病变、内膜动脉炎和小管炎,尚未被当前计算方法可靠解决。

目前,AI被视为Banff分类的补充工具,提供定量和可重复的测量,支持组织病理学评估。随着持续的方法学创新、扩展的数据集和严格的验证,AI有可能补充和加强现有的诊断框架,减少观察者间变异性,支持更可重复和定量的移植物病理学评估,并捕获半定量分级系统未完全反映的组织损伤方面。未来专注于互操作性、标准化和集成到临床实践的工作对于实现AI在肾移植诊断中的全部益处至关重要。

生物通微信公众号
微信
新浪微博


生物通 版权所有