摘要
目的:比较肿瘤中错配修复(MMR)蛋白的免疫组化检测方法。由于MMR缺陷对以下方面至关重要:(1)检测林奇综合征(Lynch Syndrome),该综合征由影响DNA MMR基因MLH1、MSH2、MSH6和PMS2的遗传变异引起;(2)辅助解读MMR基因变异;(3)决定是否使用免疫检查点阻断疗法。
方法:这项回顾性分析利用十年间提交给英国国家外部质量评估计划(NEQAS)的技术数据,比较了不同MMR免疫组化(IHC)抗体克隆、检测系统和自动化IHC平台的性能,并计算了参与者的最终综合评分(FAS)以进行性能对比。
结果:2011年至2022年间,共进行了38次MMR评估,每次评估平均每个抗原有44.8份样本提交。十年间,MMR模块的参与度显著增加。平均FAS呈现轻微的非显著上升趋势,其中前半年的评分最低(14.6),后半年的FAS评分一致性更高。在MMR IHC中,最常用的抗体克隆为MLH1的M1和ES05(FAS分别为15.7和15.1),MSH2的G219-1129和FE11(FAS分别为14.8和14.1),PMS2的EP51和A16-4(FAS分别为15.2和15.2),以及MSH6的SP93和EP49(FAS分别为16.1和15.6)。最常见的检测系统包括Ventana Optiview、Leica BondMax、Leica Bond Refine、Dako FLEX+和Ventana UltraView。
结论:提交的MMR IHC样本质量有所提高,最近评估的评分变异性降低,表明抗体克隆的性能更好,检测系统和IHC自动化平台技术也有所改进,同时参与者的技术能力也在提升。英国NEQAS提供了有关最可靠产生高质量MMR IHC染色的协议的信息和反馈,有助于准确报告日益重要的肿瘤MMR状态。
关键词:结直肠癌;DNA;免疫组化;错配修复
关于该主题的现有知识:
英国国家外部质量评估计划(NEQAS)关于错配修复(MMR)蛋白免疫组化(IHC)的经验此前尚未发表,因此本研究提供了新的信息。
本研究新增内容:
截至2022年,NEQAS的MMR IHC染色质量有所提高,变异性降低。更优性能的一级抗体克隆的使用增加,以及检测系统和IHC自动化平台的改进,共同促进了质量的提升。NEQAS提供了反馈,以优化MMR IHC协议,从而实现高质量的MMR免疫染色。
本研究可能对研究、实践或政策的影响:
NEQAS在监测实验室IHC质量控制方面发挥着关键作用,并通过提供关于抗体克隆、检测系统、IHC自动化平台及实验室协议改进的详细建议,帮助各实验室提升其MMR IHC水平。
引言:
DNA错配修复(MMR)途径能够检测并修复DNA复制过程中出现的两种潜在突变:碱基错配和插入/缺失环(IDL),这些突变尤其在重复序列中容易发生(例如微卫星——正常人类基因组中的重复DNA序列,在DNA复制过程中容易发生滑动,导致插入或缺失,统称为InDels)。MMR缺陷(dMMR)会导致未纠正的DNA错误积累,从而增加突变率和微卫星长度的变化(缩短或延长)。微卫星序列中未修复的IDL会改变其整体长度,导致微卫星不稳定(MSI)。
在肿瘤中检测dMMR对于以下方面至关重要:(1)检测和诊断林奇综合征(LS),该综合征由影响DNA MMR基因MLH1、MSH2、MSH6和PMS2的遗传变异引起;(2)辅助解读MMR基因变异,如国际胃肠肿瘤变异解读委员会(现称为ClinGen变异分类专家小组)和英国癌症变异解读小组的工作;(3)在决定是否使用免疫检查点阻断疗法时提供依据。尽管可以通过DNA测序来确定高肿瘤突变负荷和特定的COSMIC特征(SBS6、SBS14、SBS15、SBS20、SBS21、SBS26、SBS44)来诊断dMMR,但在英国病理学部门,大多数肿瘤dMMR的检测仍采用MMR免疫组化(MMR IHC),该方法利用特定抗体来检测MMR蛋白的存在与否。癌细胞核中MMR蛋白的缺失或异常表达表明存在潜在的MMR缺陷。约13%–15%的结肠腺癌存在dMMR,其中约四分之三是散发的,由MLH1基因启动子甲基化引起的右侧锯齿状病变所致,其余四分之一由LS引起。类似地,25%–30%的子宫内膜腺癌存在散发性dMMR,3%–4%由LS引起。皇家病理学家学院将MMR状态作为报告结直肠癌切除标本的核心数据项,国家健康与护理卓越研究所要求通过MMR IHC或MSI检测来筛查结直肠癌中的LS,而对于子宫内膜癌仅使用MMR IHC,反映了其日益重要的临床意义。
英国认证服务(UKAS)通过要求实验室测试符合国际标准(ISO 15189:2022《医学实验室——质量和能力要求》)来确保其符合国际标准。自2011年以来,英国国家外部质量评估计划(NEQAS ICC和ISH)一直提供MMR项目,对MMR IHC进行质量评估。英国病理/医学实验室必须参与该项目,或证明其MMR IHC检测能力符合UKAS要求。
本研究旨在利用十年间的技术数据,比较不同MMR IHC抗体克隆、检测系统和自动化IHC平台的性能。作为其教育和质量改进的一部分,NEQAS ICC和ISH旨在提供有关最可靠产生高质量MMR IHC染色的协议的信息和反馈,以便及时准确地报告日益重要的肿瘤MMR状态。
方法:
参与实验室被邀请使用NEQAS ICC和ISH提供的质量控制、福尔马林固定、石蜡包埋的组织切片进行内部MMR IHC实验。样本每季度提交一次,并交替检测MLH1/PMS2和MSH2/MSH6这对MMR蛋白;因此每对MMR蛋白每半年评估一次。
标准化:
提供了MMR正常(pMMR)和dMMR结肠腺癌的附录切片和部分组织切片,这些切片预先处理过、未染色并共同安装在一张玻璃载玻片上。相同组织块的切片也提供给抗体和平台制造商,他们随后进行MMR IHC以生成参考切片。在校准制造商的参考切片后,四位独立评估员根据预定义的标准对样本进行评分。评估员特别关注附录黏膜隐窝上皮细胞核的染色梯度(隐窝底部染色强烈,顶部几乎无染色)。评估员期望在pMMR肿瘤细胞核和内部对照基质细胞及淋巴细胞中保留MMR蛋白表达,而在dMMR肿瘤中,MMR蛋白表达仅存在于内部对照基质细胞和淋巴细胞中,肿瘤细胞核中的染色缺失。
评分:
评估员的评分范围为1至5分。1–2分表示不可接受的、无法诊断的染色质量,视为测试失败。3分表示技术上不够理想但临床结果可接受的染色。4分表示临床可接受的染色质量,仅有轻微的技术问题。5分表示最佳染色质量。评分混合的样本(即同时失败(1–2分)和通过(3–5分)的样本会重新审查并讨论,直至评估员达成共识。每个样本的最终综合评分(FAS)是各评估员评分的总和。FAS分为三类结果:不可接受(FAS评分:0–9分)、勉强可接受(FAS评分:10–12分)和可接受(FAS评分:13–20分)。不可接受的样本被视为质量评估失败。
分析:
将FAS与一级抗体克隆、IHC检测系统和自动化染色平台的数据进行比较,这些数据在Excel(Microsoft)和Prism中进行了整理和分析。FAS数据的统计比较使用了Welch’s t检验(适用于样本量和方差不等的情况)。
结果:2011年至2022年间,共进行了38次评估,编号为Run 95至Run 135,共有100个英国及英国海外领地(海峡群岛;马恩岛)参与者提交了3405份样本。每次评估平均每个抗原有44.8份样本提交(Run 95:40份样本(MLH1 20份,PMS2 20份);Run 135:175份样本(MSH2 87份,MSH6 88份)(表1)。平均FAS在评估过程中趋于稳定,并呈现轻微的非显著上升趋势(图1)。因此,观察期间的前半年的评分最低(Run 95–117:平均FAS 14.6,标准差0.89,方差0.79,四分位数范围1.2),其中Run 103的平均FAS最低,为12.6。在Run 95–117期间,评估结果之间没有显著异常值。观察期间的后半期(Run 118–135),评分一致性更高(平均FAS:15.1,标准差0.54,方差0.29,四分位数范围0.59)。其中Run 120的评分显著偏离(平均FAS:16.6,四分位数上限+1.5,四分位数范围16.2)。93.4%的样本获得了勉强可接受或更好的评分(n=3179)。226份样本(占总样本的6.6%;MLH1样本的6.8%;PMS2样本的7.1%;MSH2样本的5.1%;MSH6样本的7.6%)的评分不可接受。每次评估每个抗原的不可接受样本平均数量在2.9(MSH2)至3.8(MLH1)之间。
克隆:
在整个研究期间,ES05一直是提交最多的MLH1抗体克隆,占所有MLH1样本的56.5%。ES05的平均FAS为15.1,而表现最佳的MLH1克隆M1的平均FAS为15.7(Welch’s t检验,p=0.0038,见在线补充表1)。2011年至2022年间,ES05和M1的不可接受样本比例分别为36份(7.5%,HR:1.1)和10份(3.2%,HR:0.5)(图2A,表2)。在Run 130中,ES05的平均FAS为12.1,是一个显著的孤立异常值。
PMS2:提交最多的PMS2抗体克隆是EP51,尽管A16-4最近也很受欢迎。EP51和A16-4的平均FAS均为15.2(无显著差异,见在线补充表1),而EPR3947的平均FAS为14.7。EP51的不可接受样本比例低于A16-4(分别为4.8%和6.8%,HR分别为0.7和0.9)。EP51和A16-4的平均FAS在评估期间没有显著变化(图2B,表2)。
MSH2:G219-1129和FE11分别占MSH2样本的41.4%和37.9%,平均FAS相似(分别为14.8和14.1,无显著差异,见在线补充表1),不可接受样本比例也相似(分别为4.2%和5.5%,HR分别为0.8和1.1)。克隆79H11在MSH2克隆中平均FAS最高(15.3)(图2C,表2)。
MSH6:EP49是提交最多的MSH6克隆(49.1%),但在最新的评估中(Run 135),EP49占样本的44.9%(n=39),而SP93的比例上升至40.9%。SP93的平均FAS高于EP49(16.1 vs 15.6,有显著差异,见在线补充表1),且不可接受样本比例较低(1.9% vs 4.3%,HR分别为0.3和4.3,HR分别为1.1和0.6)。EPR3945、44和PU29占不可接受MSH6样本的61.5%,但在最近的评估中很少被提交(图2D,表2)。
主要抗体克隆的FAS性能统计比较使用了Welch’s t检验,结果显示几种抗体克隆在每个抗原(MLH1、MSH2、MSH6和PMS2)的FAS数据存在显著差异(见在线补充表1)。这项分析为选择最佳抗体克隆提供了指导:MLH1选择M1或ES05,MSH2选择FE11或G219-1129,MSH6选择SP93或EP49,PMS2选择EP51或A16-4。
检测系统:
3247份样本(95.4%)提供了参与者使用的检测系统数据(表3)。最常见的检测系统包括Ventana Optiview(n=1221,37.6%);Leica BondMax Refine KIT(n=892,27.5%);Dako FLEX+kit(n=542,15.8%);Leica Bond Refine(n=273,8.4%)以及Ventana UltraView DAB(n=158,4.9%)。这五种检测系统的平均FAS评分从Ventana UltraView DAB的13.9到Dako FLEX+kit的15.8不等。BioGenex SS Polymer-HRP在所有检测系统中的平均FAS评分最高(15.9),但该检测系统仅被用于0.55%的样本(n=22)。最常见的五种检测系统占所有有数据样本的95%,其不可接受样本的平均比例为7.4%(范围5%–13%)。尽管Ventana Optiview是使用最广泛的检测系统,但其失败率最低(5%),而Ventana UltraView DAB的失败率最高(12.7%),这与该系统样本的平均FAS评分较低相吻合(见图3)。各检测系统的失败率范围从4.5%到100%不等(平均失败率为24.5%)。有两个异常值被剔除(Leica Bond X,n=1,失败率为100%;Dako Autostainer Link 48,n=1,失败率为100%)。调整后的检测系统失败率范围为4.5%到25%(调整后的平均失败率为10.8%)。在不可接受的样本中,Leica Bond-III的失败率最高(76例失败,失败率为7.5%)。图4展示了强或非常强(可接受)的MMR IHC染色结果以及弱或非常弱(不可接受)的MMR IHC染色结果。
在3403份(99.9%)样本中提供了自动化IHC平台的相关数据。最常见的自动化系统是Ventana Benchmark ULTRA(n=1083,32.6%)和Leica Bond-III(n=1017,30%)。Ventana Benchmark ULTRA和Leica Bond-III的平均FAS评分分别为15.3和14.7。Dako Autostainer Link 48的平均FAS评分最高(15.96),占样本总数的11.7%(n=399)。
随着肿瘤MMR状态在临床上的重要性日益增加以及国家LS筛查的推广,英国各地的实验室纷纷将MMR IHC检测纳入其检测项目。这些实验室必须通过参与EQA(外部质量评估)来证明其检测能力符合国际标准。这导致英国NEQAS MMR IHC项目的规模在过去十年增长了4.4倍。随着国际和国内对肿瘤MMR状态研究的持续关注,预计该项目还会进一步发展。由于英国国家医疗服务体系(NHS)内的实验室数量有限,随着LS筛查在全国范围内的普及,该项目的发展可能会达到顶峰。未来可能出现新的技术,如果其他方法(如肿瘤基因组/外显子测序)的需求增加,MMR IHC的需求可能会下降,从而影响该项目的参与度。
十年来,不可接受样本的总体比例为6.6%(n=226)。评估人员向所有这些样本以及那些获得边缘评分的样本提供了技术反馈,以帮助提高IHC染色的质量。这是英国NEQAS MMR IHC项目的重要功能,有助于提升全国的服务水平。对于反复提交不可接受样本的参与者,我们会提供进一步的支持,但他们需要等到下一次EQA评估结果满意后才能继续进行MMR IHC诊断工作,以确保患者安全。在过去十年中,向参与者提供反馈在提高染色质量方面发挥了重要作用。最常见的反馈是抗原表达较弱和/或背景染色过强。建议参与者重新审查他们的实验方案,并提供关于抗原提取时间和抗体稀释度的具体建议,这些通常是导致染色效果不佳的原因。
过去十年中,参与者可用的试剂和硬件条件得到了改善。随着MMR UK NEQAS项目的实施,参与者对MMR IHC检测的熟悉度和操作能力不断提高。这些因素体现在图1所示的上升趋势以及后续评估中FAS评分的变化幅度减小上。
所研究的变量之间存在相互依赖性,包括抗体克隆、IHC平台、检测系统以及实验方案参数,这些因素之间的相互作用可能会影响染色结果。MMR IHC是一种具有主观解释性的检测方法。我们通过邀请来自不同技术、科学和临床背景的四位专家独立评估来尽量控制这些因素的影响。评估人员尽可能独立地给出评分,但如果一个评估人员认为样本不合格而另一个认为合格,则会标记出来进行重新讨论和重新评估,因此评估人员之间并不完全不知彼此的评分结果,这可能导致解释偏差。如果评估人员不独立评分,还可能存在一致性偏差。重新讨论有争议的样本有助于为参与者提供更高质量的反馈。然而,对参与者MMR IHC实验方案的任何性能分析都会受到多种因素的干扰,例如组织质量、固定和样本制备过程(包括切片方法和 mounting)。通过向参与者提供预先准备好的UK NEQAS对照组织切片,可以部分缓解这些影响。不过,还存在其他混淆因素,如参与者的抗原提取时间、复染方法和抗体稀释比例等。由于这些数据不完整,限制了全面分析。此外,参与实验室的NHS或私人活动情况以及诊断样本量数据也未被正式记录。
在整个项目实施过程中,MLH1的M1和ES05克隆的受欢迎程度逐渐上升,它们的平均FAS评分分别为15.7和15.1。剔除第130次评估中表现不佳的ES05样本后,ES05的平均FAS评分提高到15.4。这两个克隆可能因实验室间的技术交流而更受欢迎。A16-4的使用增加与EPR3947样本的提交量减少直接相关,这可能是因为这两种克隆在实验室中的表现存在明显差异。最近的一次评估中,79H11克隆的受欢迎程度上升,其平均FAS评分最高。SP93克隆的采用率增加可能与其在实验室中的表现优于EP49克隆有关。自第121次评估后,SP93克隆的采用率上升,这是因为SP93在实验室中的表现更好。
过去十年中,英国NEQAS MMR模块的参与度显著增加,反映了MMR IHC在临床上的重要性。MMR IHC样本的质量有所提高,最近评估的评分变异性降低,表明抗体克隆的表现、检测系统和IHC自动化平台技术的使用情况都有所改善,参与者的技术能力也在提升,尽管这些因素之间存在相互依赖性。某些抗体克隆在MMR IHC中占据主导地位,其FAS评分较高,其中MLH1的M1和ES05(FAS 15.7和15.1)、MSH2的G219-1129和FE11(FAS 14.8和14.1)、PMS2的EP51和A16-4(FAS 15.2和15.2)以及MSH6的SP93和EP49(FAS 16.1和15.6)表现优异。最常用的检测系统包括Ventana Optiview、Leica BondMax、Leica Bond Refine、Dako FLEX+和Ventana UltraView。Dako Flex+kit在所有检测系统中具有最高的FAS评分,因此被推荐使用。尽管Dako Autostainer Link 48仅占样本总数的11.7%,但其FAS评分最高,也被推荐使用。没有一种抗体克隆、检测系统或IHC自动化平台系统会始终导致不可接受的评分结果。总体而言,英国NEQAS MMR模块的数据表明,过去十年实验室的表现有所提升,并为英国NEQAS的建议和指导提供了依据。
感谢参与英国NEQAS MMR EQA模块的贡献者和参与者。
打赏