甲状腺细针穿刺细胞学与组织病理学的相关性研究：南非西开普省一家三级公共实验室的六年回顾性分析

时间：2026年2月14日

来源：Diagnostic Cytopathology

编辑推荐：

这篇综述通过分析2016年至2021年间1703例甲状腺细针穿刺细胞学（FNAC）样本，系统评估了贝塞斯达报告系统（TBSRTC）在南非一家三级解剖病理学实验室的应用情况。研究发现，非诊断性样本率（50.1%）远高于预期，强调了加强超声引导下穿刺及快速现场评估（ROSE）培训的必要性。文章全面分析了各贝塞斯达分级的恶性风险（ROM）和诊断效能指标，为在资源有限环境下优化甲状腺结节的初始筛查提供了重要数据支撑。

引言

甲状腺结节在普通人群中较为常见，通过超声检查的检出率可达60%，但其恶性风险介于5%至20%之间。因此，需要一种有效、经济且微创的初始筛查方法，以可靠地评估甲状腺结节的恶性风险（ROM），从而减少不必要的手术，同时保留适当的手术干预。甲状腺细针穿刺细胞学（FNAC）在全球范围内已被接受为甲状腺结节的初始筛查方法。用于评估甲状腺结节和报告甲状腺FNAC的多种系统中，贝塞斯达甲状腺细胞病理学报告系统（TBSRTC）应用广泛，它将甲状腺FNAC分为六个诊断类别，每个类别都有隐含的ROM，并提供了基于证据的临床管理指南。然而，不同研究显示甲状腺FNAC的检测性能存在显著差异，细胞病理学检查对恶性肿瘤的误诊仍然是甲状腺病理学中最棘手的问题之一。因此，每个机构都有必要评估甲状腺FNAC作为初始诊断测试的性能以及各自诊疗人群中各诊断类别的ROM。

本研究旨在对南非开普敦Groote Schuur医院国家卫生实验室服务（NHLS）解剖病理学实验室内的甲状腺细胞学报告实践进行回顾性审计，重点关注：TBSRTC类别的使用和分布情况；仅基于细胞学-组织学相关性得出的每个类别的ROM；以及FNAC在常规实践中的诊断性能，包括敏感性、特异性、阳性预测值（PPV）、阴性预测值（NPV）和总体准确性。

方法

本研究经开普敦大学人类研究伦理委员会批准。这是一项回顾性审计，使用了从NHLS实验室信息管理系统和中央数据仓库提取的现有实验室数据。数据集仅包括作为常规诊断服务一部分生成的细胞学和组织病理学报告，不包含临床或放射学信息。所有甲状腺FNAC标本最初由经过董事会认证的细胞学家筛查，随后由解剖病理学住院医师审核，最后由顾问病理学家进行最终审核和授权。组织病理学标本的处理和报告流程类似。

细针穿刺操作

在本研究环境中，甲状腺FNAC在公共卫生系统的多个转诊机构进行。由于本研究使用的是回顾性实验室数据集，操作者详细信息（如操作者身份、穿刺次数、采样是触诊引导还是超声引导）未记录在NHLS实验室信息管理系统中，因此无法进行分析。根据本地区的常规服务实践，大多数FNAC由门诊诊所的临床医生执行，超声引导的使用不一致，取决于机构资源和临床医生的专业水平。细胞学家在本系统中不执行FNAC。

病例检索与分类程序

本研究检索了2016年1月1日至2021年12月31日期间报告的所有甲状腺FNAC标本和甲状腺外科病理标本。报告通过唯一的患者识别号以及标本采集的日期和解剖部位（细针穿刺、核心针活检或切除）进行匹配。数据分析基于研究期间报告的每个独立的甲状腺FNAC标本进行，而非单个患者。审核每个甲状腺FNAC报告，记录最终报告中是否包含贝塞斯达类别。为了将FNAC结果与最终组织病理学结果相关联，所有未包含贝塞斯达类别的FNAC报告均根据报告病理学家提供的叙述性报告分配一个类别。最终的组织病理学诊断根据当前世界卫生组织内分泌和神经内分泌肿瘤分类（第5版）进行分类，分为非肿瘤性疾病、良性肿瘤性病变、低风险肿瘤和恶性肿瘤。

描述性分析与细胞学-组织学相关性

使用简单的描述性统计总结不同贝塞斯达诊断类别、性别和转诊机构中甲状腺FNAC病例的分布情况。对研究期间所有具有相应外科组织病理学标本的FNAC病例进行细胞学-组织学相关性分析。在具有多次FNAC和相应组织学检查的病例中，细胞组织学相关性基于记录的最高贝塞斯达类别。由于本研究代表了服务层面的回顾性实验室审计，没有临床或放射学数据来告知手术指征；因此，进行组织学检查的病例子集反映了现实世界中临床医生驱动的选择及其固有的验证偏倚。

恶性风险（ROM）计算

每个贝塞斯达类别的ROM计算遵循可比较的细胞病理学审计中使用的惯例。对于大多数病例未进行手术随访的I类和II类，ROM计算为该类别中恶性组织学病例数除以该类别的细胞学病例总数（包括有和组织学和无组织学的病例）。对于III至VI类，ROM计算为该类别中恶性组织学病例数除以该类中具有组织学结果的细胞学病例总数。这种方法避免了高估I类和II类的ROM，并与已发表的实践保持一致。

诊断准确性分析

诊断准确性指标以组织病理学作为参考标准进行计算。仅包括后续有外科组织学检查的FNAC病例。非诊断性FNAC被排除在诊断准确性计算之外。细胞学结果被二分用于二元分析，II类被视为阴性，III至VI类被视为阳性。这反映了甲状腺FNAC准确性研究中的既定实践，并与当前的管理建议一致，后者将III至VI类视为需采取行动的或可疑的，通常会促使重复取样、分子检测或诊断性肺叶切除术。组织学同样被二分为阴性或阳性。使用这个二分框架构建了一个2×2列联表，并计算敏感性、特异性、阳性预测值（PPV）、阴性预测值（NPV）和总体诊断准确性。

统计分析

所有数据均以MS Excel格式从NHLS中央数据仓库提取。数据在MS Excel和IBM SPSS Statistics for Windows（版本29.0）中进行分析。定量数据用均值和范围描述。定性数据用频率和百分比描述。进行交叉表和卡方检验以确定变量之间的关联，概率值p≤0.05被认为具有统计学意义。

结果

样本

在2016年1月1日至2012年12月31日期间，从NHLS中央数据仓库检索到来自1273名患者的1703份甲状腺细胞学标本报告。重复FNAC很常见，25.6%的患者接受了不止一次操作。第二次取样时，大多数病例保持在相同或相邻的贝塞斯达类别内，升级到高风险类别的情况很少发生。在贝塞斯达V类和VI类中重复FNAC并不常见，这与细胞学检查可疑或恶性后直接转诊手术的可能性更大一致。患者的平均年龄为52.4岁，女性占绝大多数，女男比例为7.1:1。

十个医疗机构贡献了94.5%的FNAC。大型三级转诊医院Groote Schuur医院占了62.5%的穿刺样本。非诊断性标本的比例因机构类型而异：在GSH进行的FNAC中有46.6%是非诊断性的，而来自转诊机构的穿刺样本中这一比例为56.0%。卡方检验显示穿刺部位与标本充足性之间存在统计学上的显著关联。

贝塞斯达类别的使用

贝塞斯达系统于2017年正式纳入本机构的常规甲状腺细胞学报告；因此，2016年的FNAC报告在编码诊断或叙述性报告中均未包含贝塞斯达类别。包含贝塞斯达类别的甲状腺细胞学报告比例从2017年的40.1%增加到2021年的92.7%。为了进行细胞学-组织学相关性分析，所有未包含贝塞斯达类别的甲状腺FNAC报告均根据报告病理学家提供的叙述性报告和诊断分配一个类别。

各贝塞斯达类别的病例分布

在1703例FNAC病例中，854例（50.1%）被分类为I类（非诊断性），517例（30.4%）为II类（良性），137例（8.0%）为III类（意义不明的异型性），109例（6.4%）为IV类（滤泡性肿瘤），44例（2.6%）为V类（可疑恶性），42例（2.5%）为VI类（恶性）。按年份分层时，非诊断性穿刺样本的比例在整个研究期间持续较高，没有明显的时间改善。

组织病理学结果

研究期间，18.5%的FNAC病例可获得组织病理学相关性分析。患者的平均年龄为49.7岁。女男比例为6.1:1。所有组织病理学诊断被分为四组用于分析目的：良性非肿瘤性病变、良性肿瘤性病变、低风险肿瘤和恶性肿瘤。这些类别随后用于推导ROM和诊断准确性分析中应用的二分化“阴性”和“阳性”组织学分类。

细胞学-组织学相关性

对315例具有相应外科病理学检查的FNAC病例进行了细胞学-组织学相关性分析。每个贝塞斯达类别内最终组织学诊断的分布情况已总结。良性非肿瘤性和良性肿瘤性病变占了I至IV类组织学结果的大部分，而恶性肿瘤在V类和VI类中占主导地位。根据2022年WHO甲状腺肿瘤分类定义的低风险肿瘤在几个贝塞斯达类别中被识别出。根据2022年WHO分类，低风险甲状腺肿瘤属于良性和恶性之间的中间类别，被指定为“肿瘤”而非“癌”，以降低过度治疗的风险。该组包括具有乳头状核特征的非浸润性滤泡性甲状腺肿瘤（NIFTP）、恶性潜能未定的肿瘤（UMP）和透明变梁状肿瘤（HTT）。为了进行统计分析，这些被排除在恶性类别之外。

恶性风险与诊断准确性

计算并比较了每个贝塞斯达类别的估计ROM与TBSRTC的已公布估计值。包括I类和II类在内的总体ROM为7.4%。I至V类的ROM在已公布的TBSRTC范围内，而VI类的ROM较低。

使用上述二分化细胞学和组织学分类计算诊断准确性指标。FNAC的敏感性为73.4%，特异性为41.9%，PPV为46.6%，NPV为69.5%，总体诊断准确性为54.8%。这些指标反映了FNAC在手术验证子集（占研究期间所有穿刺样本的18.5%）中的性能，该子集因临床选择而富含恶性肿瘤。

讨论

本研究对一家三级解剖病理学实验室内为期六年的甲状腺FNAC报告实践进行了审计，重点关注贝塞斯达类别的使用、细胞学-组织学相关性、ROM和诊断准确性。贝塞斯达术语的使用逐步增加，2017年至2021年间平均合规率为74.9%。本队列中贝塞斯达类别的分布与国际上许多系列研究有显著差异，原因是非诊断性穿刺样本比例高（50.1%），这超过了TBSRTC推荐的2%-20%，也高于其他研究总结的比率。已公布的南非估计值显示非诊断性比率差异很大，但这些数据来自较小的队列，主要是超声引导下的FNAC，因此不能与本实验室审计直接比较。

常规实验室数据未包含操作细节，例如使用触诊与超声引导、穿刺次数、针头规格和操作者经验，这些已知会影响甲状腺FNAC标本的充足性。研究显示，与触诊引导技术相比，超声引导FNAC显著提高了标本充足率。然而，本研究中非诊断性穿刺样本的高比例与在GSH放射科进行的另一项研究结果一致，该研究检查了236例超声引导FNAC，报告第一次、第二次和第三次穿刺的非诊断性比率分别为66%、64%和52%，这表明在当前服务条件下，仅靠超声引导并不能确保标本充足。相比之下，其他南非和东非机构报告的非诊断性比率较低，这强调了程序标准化的必要性，包括使用带有快速现场评估（ROSE）的超声引导和提供者培训，这已被证明可以提高充足率。此外，本队列中针对良性疾病进行手术的比例很高，这可能反映了与压迫症状、美观问题或不确定的影像特征相关的临床决策，这些均未在实验室数据集中捕获。

在本研究中，使用所有FNAC计算贝塞斯达I类和II类的ROM，以尽量减少因选择性手术随访导致的高估，而对于III-VI类，ROM仅基于有组织学确认的病例。总体而言，本研究的ROM估计值与TBSRTC报告的贝塞斯达I-V类范围一致。观察到的VI类较低ROM可能反映了机构或队列特异性因素。回顾性FNAC审计中的ROM估计对选择偏倚和方法学差异高度敏感。对于I类和II类，仅从手术切除病例得出的ROM估计值往往会高估恶性肿瘤风险；而假设未切除结节是良性的——正如本研究中所做的那样——则会低估ROM。真正的ROM可能介于这两个估计值之间。因此，报告的诊断准确性指标描述了FNAC在我们环境中手术选择队列中的性能，这与用于其他甲状腺细胞学-组织学相关性研究的方法一致。

诊断准确性分析得出的敏感性为73.4%，特异性为41.9%，PPV为46.6%，NPV为69.5%，总体准确性为54.8%。已发表研究中的诊断准确性指标差异很大，这是由于方法学、病例选择、细胞学-组织学关联实践和二分策略的差异所致。这些发现强化了通过地方审计对FNAC结果进行背景解释的必要性，特别是在程序和解释变异性显著的情况下。

局限性

这项基于实验室的审计缺乏与临床和放射学数据的整合。因此，组织病理学单独作为参考标准，没有临床监测，这可能有助于高估良性类别的敏感性和低估特异性。仅有15.9%的II类穿刺样本接受了手术随访，这限制了对假阴性结果的评估。由于实验室数据集的限制，无法评估操作因素和操作者性能。未重新审查细胞学和组织学切片；然而，所有标本都按照上述描述进行了常规筛查和多级审查和报告。这些局限性是回顾性实验室审计所固有的，但并未削弱系统记录真实世界服务条件下FNAC性能的价值。

结论

本研究对南非一家大型公共部门实验室中TBSRTC的使用和甲状腺FNAC性能进行了为期六年的评估，代表了来自资源有限的撒哈拉以南非洲地区最大的队列之一。分析显示非诊断性穿刺样本比例高，诊断准确性存在差异，反映了普遍存在的程序和基础设施限制。这些发现强调了需要通过改进程序标准化、教学培训、增加获取带有ROSE的超声引导穿刺的机会以及扩大提供者培训来加强FNAC实践。发展综合的临床-放射学-病理学数据集以及省级或国家甲状腺细胞学登记处将有助于性能监测，并为制定适合当地的标准护理提供信息。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部