前列腺癌作为男性泌尿系统最常见的恶性肿瘤,其诊断和治疗策略高度依赖于病理组织学分级。其中,Gleason评分系统是前列腺癌分级诊断的"金标准",而活检标本的Gleason评分更是临床医生制定治疗方案的关键依据。然而,前列腺癌具有高度异质性和多灶性的特点,这给通过有限的组织标本准确评估整体肿瘤恶性程度带来了巨大挑战。特别是在Gleason评分3+4与4+3这两种相邻分级之间,虽然组成成分相同(均为Gleason 3和Gleason 4成分),但因其主要成分不同而被划分为不同的国际泌尿病理学会(International Society of Urological Pathology, ISUP)风险组别,代表着截然不同的生物学行为和临床预后。临床实践中,当活检标本中同时存在Gleason 3和Gleason 4成分时,病理医生通常采用两种评分方法:整体活检评分(综合考虑所有阳性活检核心中最常见和最高级别成分)和最高活检评分(仅取所有阳性核心中的最高Gleason评分)。由于这两种方法的评分原则不同,可能导致对同一病例得出不同的分级结果,进而影响临床决策。例如,Gleason评分3+4的患者可能适合主动监测,而Gleason评分4+3的患者则通常需要更积极的治疗,包括术中淋巴结清扫。因此,明确哪种活检评分方法能更准确地预测根治术后的实际Gleason评分,对于避免过度治疗或治疗不足具有重要意义。在此背景下,扬州大学医学院的郭成浩教授团队在《European Journal of Surgical Oncology》上发表了一项重要研究,通过比较整体活检评分和最高活检评分与根治术后全器官切片确定的实际Gleason评分之间的一致性,为这一临床难题提供了科学答案。本研究主要采用了以下关键技术方法:研究纳入了2023年1月至2025年1月期间在苏北人民医院就诊的124例前列腺癌患者队列,所有患者均接受经会阴前列腺活检(系统活检或主观融合活检)后行根治性前列腺切除术。术后标本制备成全器官大切片作为实际Gleason评分的金标准。收集所有阳性活检核心的Gleason评分及活检前MRI数据,采用SPSS 26.0软件进行统计学分析,使用χ2检验比较两种评分方法的一致性差异。研究结果基线资料本研究共纳入124例患者,平均年龄69.02±7.18岁,平均前列腺特异性抗原(prostate-specific antigen, PSA)水平为14.66±13.27 ng/mL,平均阳性活检核心数为4.13±2.40。其中实际Gleason评分3+4者77例(62.1%),Gleason评分4+3者47例(37.9%)。活检前MRI PI-RADS评分≥3者81例(65.3%),PI-RADS评分<3或未行MRI检查者43例(34.7%)。两种评分方法与实际Gleason评分的一致性比较整体活检评分与实际Gleason评分的一致性为64.5%(80/124),其中在Gleason评分3+4组的一致性为66.2%(51/77),在Gleason评分4+3组的一致性为61.7%(29/47)。最高活检评分与实际Gleason评分的一致性为47.6%(59/124),其中在Gleason评分3+4组的一致性为49.4%(38/77),在Gleason评分4+3组的一致性为42.6%(21/47)。两种评分方法的一致性差异具有统计学意义(64.5% vs. 47.6%;χ2=7.219,P<0.05),表明整体活检评分在评估实际Gleason评分3+4或4+3病例时具有更高的准确性。MRI对评分一致性的影响在81例PI-RADS评分≥3的患者中,整体活检评分与实际Gleason评分的一致性提高至71.6%(58/81),最高活检评分的一致性提高至54.3%(44/81)。而在43例PI-RADS评分<3或未行MRI检查的患者中,两种评分方法的一致性分别为51.2%(22/43)和34.9%(15/43)。不同PI-RADS评分组别内的一致性差异均具有统计学意义(P<0.05),表明无论采用哪种评分方法,活检前进行MRI检查且PI-RADS评分≥3均可显著提高活检结果与实际Gleason评分的一致性。进一步比较相同PI-RADS评分组别内两种评分方法的一致性发现,当PI-RADS评分≥3时,整体活检评分的准确性仍显著高于最高活检评分(71.6% vs. 54.3%;χ2=5.188,P<0.05)。而在PI-RADS评分<3组,两种评分方法的一致性差异无统计学意义(51.2% vs. 34.9%;P=0.127)。研究结论与讨论本研究通过系统比较两种常用活检评分方法与实际Gleason评分的一致性,得出了明确结论:对于实际Gleason评分为3+4或4+3的前列腺癌患者,当活检结果中同时检测到Gleason 3和Gleason 4成分时,整体活检评分与实际Gleason评分的一致性显著高于最高活检评分。这一发现与Kroon等关于Gleason 4成分比例的研究结果相呼应,凸显了整体活检评分在评估成分比例方面的优势。研究结果可以从前列腺癌的生物学特性得到解释。整体活检评分基于所有活检结果进行综合评估,其原理更符合Gleason评分"主要+次要"的模式,具有更好的辨别能力。而最高活检评分在某些情况下可能导致评分过高估计,特别是当仅存在少量高级别成分(如单个Gleason评分4+3或4+4核心)时,直接采用最高评分可能造成患者过度治疗。值得注意的是,本研究未纳入活检中检测到Gleason 5成分的病例。这是因为无论是ISUP还是泌尿生殖病理学会(Genitourinary Pathology Society, GUPS)的共识均建议,只要检测到Gleason 5成分,无论其百分比是否低于5%,都应纳入评分。这种情况下,病例将被立即归类为高风险层级,治疗方案基本确定,进一步讨论主要成分是Gleason 3还是Gleason 4的意义有限。MRI作为前列腺癌常规诊疗中的重要影像学手段,本研究证实其在前列腺癌精准分级中同样发挥关键作用。当MRI清晰显示靶病灶(PI-RADS评分≥3)时,整体活检评分和最高活检评分与实际Gleason评分的一致性均显著提高,且整体活检评分仍优于最高活检评分。这一发现与欧洲泌尿外科学会(European Association of Urology, EAU)指南推荐活检前常规进行MRI检查的建议相一致。本研究采用的活检方式均为系统活检或系统结合主观融合活检,遵循当前前列腺活检方案的一般建议。整体活检评分与最高活检评分的关系类似于靶向+系统活检与单纯靶向活检的关系。整体活检评分类似于靶向+系统活检,具有避免过度诊断和过度治疗的优势;而最高评分方法类似于靶向活检,可避免高级别病灶被低级别病灶混淆,防止低估前列腺癌的严重程度。两种方法各有优劣,本研究的目的并非完全用整体活检评分取代最高活检评分,而是评估和量化两种方法在处理实际Gleason评分3+4或4+3病例时的相对优劣,为临床决策提供可靠的理论基础。该研究也存在一定局限性,包括单中心回顾性研究设计、样本量相对较小,以及部分患者因各种原因未接受前列腺MRI检查而被纳入PI-RADS评分<3组,可能对研究结果产生一定影响。综上所述,这项研究为前列腺癌活检病理评分提供了重要循证医学证据,表明整体活检评分是一种可靠的前列腺活检评分方法,能在临床实践中提供相对可靠的活检病理评分,有助于制定合适的个体化治疗方案。特别是在MRI明确指示靶病灶的情况下,整体活检评分的优势更为明显,这对推动前列腺癌精准医疗发展具有重要意义。