摘要
目的
前列腺外延伸(EPE)对前列腺癌(PCa)患者的外科手术计划有显著影响,会改变保神经手术和新辅助治疗的决策。然而,基于李克特量表的放射学(rEPE)评估在临床决策中的诊断准确性不足。因此,本研究旨在评估rEPE评分与临床参数,以开发一种临床可行的决策树,用于术前风险分层。
方法
这项回顾性单中心研究包括了2012年1月至2018年10月期间接受根治性前列腺切除术的429名连续性PCa患者。所有患者均接受了多参数MRI检查,并进行了PI-RADS评分和rEPE分级(0-3级)。临床参数包括PSA密度(PSAD)和活检时的ISUP分级组(GG)。通过单变量和多变量逻辑回归分析确定了EPE的预测因素。使用二分类方法开发了一个临床决策树,将患者分为不同风险组。
结果
在145名患者(33.8%)中确认了EPE的存在。多变量分析表明,rEPE等级(OR 2.64,p < 0.001)和活检时的GG分级(OR 1.41,p < 0.001)是独立预测因素。决策树将48%的患者分为高风险组(rEPE等级3:89%的EPE风险)和低风险组(rEPE < 3 + PSA < 0.2 ng/mL² + GG < 4:13%的EPE风险),而52%的患者属于中等风险组(28-45%的EPE风险)。
结论
结合MRI衍生的rEPE分级、PSAD和活检GG分级的决策树能够可靠地识别出EPE高风险和低风险患者。这一工具有助于就保神经手术和新辅助治疗做出明智的决策,可能有助于个性化治疗计划的制定。
关键相关性声明
结合常规MRI和临床标志物的决策树能够可靠地将前列腺癌患者分为高风险和低风险组,支持个性化的外科手术计划。
要点
EPE影响前列腺癌患者的外科手术决策。结合MRI上的EPE等级、PSAD和活检等级可以提高风险分层。开发的决策树能够将每两名患者中就有一名准确分到不同的EPE风险组,可能改善个性化的外科手术计划。
引言
前列腺癌(PCa)是全球男性中第二常见的癌症,预计到2040年发病率将翻倍[1]。早期和准确的诊断对于有效管理和治疗至关重要。前列腺MRI在PCa诊断中已成为必需,尤其是随着前列腺影像报告和数据系统(PI-RADS)的发展,它为活检决策提供了支持[2]。虽然PI-RADS主要帮助标准化影像和临床显著PCa的风险分层,但MRI also 对局部分期很重要,尤其是在预测前列腺外延伸(EPE)方面[3,4,5,6,7]。EPE是指肿瘤超出“前列腺包膜”范围,因此准确评估潜在的EPE对于选择适当的治疗方案至关重要[8, 9]。治疗决策可能需要在不同方法之间进行选择,包括手术与放疗或放疗加雄激素剥夺疗法[10,11,12,13]。此外,由于高风险EPE患者手术边缘阳性的风险增加,这可能与生化复发和转移相关,因此通常避免进行保神经手术[8, 11,12,14]。
在这种背景下,已经开发了超越PI-RADS的更全面和结构化的MRI报告系统EPE评分系统[3,4,5,6,7]。准确的放射学(rEPE)评估可能引导外科医生和患者的决策,特别是在需要非保神经手术时。然而,过去的rEPE评估缺乏可靠的诊断准确性,因此未能应用于常规临床决策[15]。
因此,我们旨在评估MRI上的rEPE评分与其他放射学和临床参数在前列腺切除术前预测EPE的能力。此外,我们旨在开发一个临床可行的决策树,以改善EPE的可能性的术前评估,从而优化手术计划并改善患者预后。
研究样本
2012年1月至2018年10月期间,在我们的机构内,连续接受MRI引导的前列腺活检(如果预活检MRI结果为阴性)且临床怀疑患有PCa的患者被纳入评估范围。此队列中的一个子集之前未包含在研究EPE的分析中[16, 17]。未接受前列腺切除术的患者被排除在进一步分析之外。此外,还排除了在MRI后超过一年才进行前列腺切除术的患者、缺失PSA值的患者、MRI质量不足的患者、前列腺切除术前接受过局部治疗(如近距离放疗、放射治疗、高强度聚焦超声)的患者以及缺失病理学报告的患者(见图1)。
MRI方案和PI-RADS评分
MRI检查遵循PI-RADS和ESUR技术推荐指南进行,之前已有相关报告[16, 18, 19]。成像在1.5-T(Magnetom Avanto,西门子医疗)和3-T MRI扫描仪(Magnetom Skyra,西门子医疗)上进行,采用了包含T2加权成像(T2W)、扩散加权图像以及动态对比增强序列的MRI方案(如果可用)。所有MR图像在分析前均根据国家前列腺MRI的诊断要求进行了足够质量的检查[20]。在经验丰富的放射科医师(P.A.和T.P.,每位有超过10年的经验)的监督下,由两位放射科医师(C.A.H.和N.L.B.,各有3-5年经验)使用PI-RADS v.2.1标准对初步报告中的前列腺病变进行了共识评估[19],并分配了rEPE等级[7]。rEPE分级遵循Mehralivand等人的方法:等级0表示无EPE嫌疑;等级1表示病变的曲线接触长度>1.5 cm或包膜膨出;等级2表示曲线接触长度>1.5 cm且包膜膨出;等级3表示明显的EPE或侵犯邻近解剖结构。MRI定义的病变与从正式病理报告中提取的组织病理学诊断进行了关联,遵循特定研究的分层注释协议(见补充材料)。使用半自动三维分割工具在T2W图像上评估了整个前列腺体积(PV)[17]。
前列腺活检
所有MRI/US融合引导的经直肠靶向活检均由我们三级大学中心的泌尿科医师团队(每位有超过10年的经验)执行。首先,按照先前的描述对每个目标病变进行了三个核心的靶向活检[21]。其次,分别从前列腺尖端、侧面中部、基底和尿道周围区域进行了系统的活检,每个部位取10个核心。仅当预活检MRI结果为阴性(PI-RADS 1-2)时才进行系统活检。标本由经验丰富的病理学家(包括S.S.)按照国际泌尿病理学会(ISUP)指南进行检测和分析[22]。
前列腺切除术和前列腺外延伸的评估
对于组织学确诊的PCa患者,进行了耻骨后根治性前列腺切除术。在可能的范围内尽可能保留神经,并在手术过程中对切除边缘进行了术中冷冻切片检查。一旦确认切除边缘无肿瘤,就在膀胱颈和尿道残端之间建立吻合口,然后继续手术。随后,切除的标本由我们机构的专业病理学家(包括S.S.)进行了宏观和微观检查。具体来说,标本被测量、染色,然后切割用于微观分析,所得片段用石蜡固定。测量了前列腺、精囊和输精管的尺寸,并在制备表面上用不同颜色标记,以便后续的微观分析。这确保了清晰识别切除边缘及其关系。处理后,标本在光学显微镜下检查Gleason评分(ISUP分级组(GG)TNM分期以及EPE、血管侵犯、神经周围侵犯和精囊侵犯等因素。
结果和统计
本研究的主要目的是识别能够预测PCa患者根治性前列腺切除术时EPE的疾病特异性患者特征和影像标志物。EPE的评估遵循ISUP制定的指南[23]。连续变量用均值和标准差(std)描述。名义/分类数据用频率和百分比报告。所有获得的影像标志物和疾病特异性患者特征都被用于EPE的预测,并报告了比值比(OR)。每个标志物的单独预测性能使用Python的statsmodels库中的logit函数进行测试。之后,进行了多变量测试以评估标志物的独立预测性能。双侧p值<0.05被定义为统计学显著。此外,基于可用标志物开发了一个临床适用的决策树分类器,用于定义EPE的风险组。我们使用了scikit-learn库中实现的基于规则的决策树分类器,该分类器基于分类和回归树(CART)算法[24]。该算法通过递归划分数据来最大化Gini杂质减少,构建二元分割。特征选择和分割阈值是自动确定的,仅保留最具信息量的变量。为了确保临床可解释性和防止过拟合,最大树深度限制为3个节点。模型开发与逻辑回归分析独立进行。为了评估泛化能力和鲁棒性,我们进行了5折分层交叉验证,并报告了带有标准差的平均性能指标。最终的临床应用决策树是在整个队列上开发的。
EPE的基于患者的检测准确性通过1000次重复的自助法计算敏感性、特异性、阴性预测值(NPV)和阳性预测值(PPV)来报告。此外,还使用决策曲线分析评估了开发出的决策树的临床价值。统计分析使用Python(v.3.8.10)和scipy(v.1.5.4)及scikit-learn(v.0.23.2)库进行。
结果
本研究共纳入1327名患者,其中429名符合最终分析的条件。队列的平均年龄为66.7岁(±7.4岁),平均血清PSA值为12.4 ng/mL(±10.7;表1)。大多数患者(81.1%,n=348)活检时的ISUP GG等级为2或更高,99.1%(n=425)的PI-RADS评分为3或更高。在患者层面,rEPE等级0、1、2和3分别对应185名(43.1%)、112名(26.1%)、88名(20.5%)和44名(10.3%)。在145名患者(33.8%)中确认了EPE,在284名(66.2%)中排除了EPE。
表1 样本特征
影像标志物和活检结果与EPE的关联
随着PI-RADS评分和rEPE等级的增加,EPE的患病率也增加(见图2)。在PI-RADS评分为3的患者中,19.1%出现EPE,而评分为4和5的患者EPE率分别为24.3%和41.3%。相比之下,在rEPE等级为0的患者中EPE发生率为19%,等级为1的患者为31%,等级为2的患者为41%,等级为3的患者为89%。根据各自的PI-RADS评分和MRI放射学EPE分级,绘制了具有组织学前列腺外延伸(hEPE;红色)的患者分布图。x轴显示了MRI评估的评分或分级,y轴显示了EPE患者的百分比。单变量逻辑回归显示,PI-RADS评分(OR 2.07,p < 0.001)、rEPE分级(OR 2.35,p < 0.001)、活检中的GG(OR 1.51,p < 0.001)、MRI获取的PSAD(OR 6.63,p < 0.001)、PSA(OR 1.05,p < 0.001)以及MRI上的病灶大小(OR 1.07,p < 0.001)与EPE之间存在关联(表2)。相反,在多变量逻辑回归中,仅rEPE分级(OR 2.64,p < 0.001)和活检中的GG(OR 1.41,p < 0.001)与EPE的关联具有统计学显著性。表2展示了影像学和疾病特异性指标对组织学前列腺外延伸的预测能力。
具有最高PPV的指标是rEPE分级3。在44名rEPE分级为3的患者中,有39人(89%)确实存在EPE,但该指标的敏感性较低,仅为27%,因为大多数EPE病例的分级低于3(补充表1)。这一发现强调了在中等EPE风险情况下需要额外预测因子的重要性。PSAD > 0.2 ng/mL的PPV为52%,ISUP GG > 4的PPV为55%。相反,几个指标显示出较高的NPV。活检中GG 1的PCa、PI-RADS评分 < 4、rEPE分级0和PSAD < 0.2 ng/mL的NPV分别为85%、84%和78%(补充表1)。
我们开发了一个适用于整个队列的EPE风险评估决策树,以提供临床可行的工具。在5折交叉验证中,该模型表现出稳健的性能(AUC:0.72 ± 0.04;准确率:0.74 ± 0.04)。最终的决策树算法自动选择了三个最相关的预测因子来分层EPE风险:rEPE分级、MRI获取的PSAD和活检中的GG(图3和补充材料)。根据开发的决策树,临床医生首先应考虑报告的rEPE分级,因为rEPE分级为3的男性具有非常高的EPE风险(高风险组;89%的EPE风险)。如果rEPE分级≤2,PSAD < 0.2 ng/mL²,且活检显示GG < 4的PCa,则EPE风险低于13%(低风险组)。所有不属于高风险和低风险组的患者被视为中等风险组,其EPE风险为28-45%(图3)。总体而言,决策树将48%(208/429)的患者分为高风险组和低风险组,而52%的患者具有中等EPE风险。
我们开发的用于评估EPE风险的临床决策工具基于MRI上的放射学(r)EPE分级、MRI上的前列腺特异性抗原密度(PSAD)以及活检中的分级组(GG)。可以看出,48%的队列患者可以可靠地被划分为低风险组(13%)和高风险组(89%),这可能有助于为这些患者制定更个性化的治疗计划。
我们提出的三节点策略(rEPE评分3或PSAD ≥ 0.2或ISUP GG ≥ 4)和两节点策略(rEPE评分3或PSAD ≥ 0.2)在临床医生接受宽松阈值时提供最高的净收益,这意味着即使只有约五分之一的患者实际上患有EPE,他们也会升级治疗(补充图1)。然而,当要求几乎每个被标记的患者确实患有EPE时,这些策略的临床效用会降低。相比之下,最严格的单节点策略(仅EPE评分3)虽然净收益较低,但在非常严格的阈值下仍保持积极的临床效用,因为在这种情况下,大约九分之一的被标记患者确实患有EPE。这表明,对于希望最小化不必要的治疗升级的患者和临床医生来说,仅EPE评分3是最可靠的指标;而在缺失EPE的后果较为严重且可以接受一定程度过度治疗的情境中,多节点组合策略具有更高的临床价值。
本研究调查了多种预测EPE的标志物,重点关注MRI上确定的rEPE分级。研究结果强调了rEPE分级在术前EPE风险评估中的核心作用,同时考虑了PI-RADS评分、PSAD和活检中的GG。在这个大型队列中,EPE的患病率为33.8%(145/429),与其他研究结果一致,尽管我们的样本中高級别PCa的比例较高(GG ≥ 3为54.7%,而其他研究为29.1%-51.0% [3,4,5,7])。尽管如此,所研究标志物的诊断性能与Mehralivand等人和Park等人的观察结果一致 [4,7]。MRI上的rEPE被证明是最准确的EPE预测因子,多变量分析显示rEPE分级和活检中的GG是重要的EPE标志物 [4,7]。然而,我们的发现支持了先前的观察结果,即MRI衍生标志物在EPE风险临床决策中的敏感性和特异性不足以作为唯一指标 [15]。最近的研究表明,将MRI特征与关键的临床和活检变量结合起来,可以改善EPE的术前预测,相比单独使用MRI或临床参数更为有效。特别是,结合标准化MRI评估与PSA、PV和活检中的GG等因素的EPE风险模型,能够实现更个性化的(包括侧别特定的)风险分层,从而更好地支持保留神经的外科手术规划 [25]。这些发现与我们将rEPE与简单临床标志物结合起来,为术前EPE风险评估提供实用框架的方法一致。
在临床实践中,具有统计学意义的标志物往往难以直接转化为实用的决策工具。为解决这一差距,我们开发了一个基于三个公认且易于获取的标志物的临床决策工具,使用二元决策方法进行风险评估。该工具能够将患者可靠地分为高风险组(rEPE ≥ 3)和低风险组(rEPE < 3 + PSAD < 0.2 ng/mL² + GG < 4),其EPE风险分别为89%和13%。鉴于所使用的参数,该工具可以轻松整合到临床工作流程中,无需额外的图像分析。然而,该决策工具仅将一半的患者(48%)分类为高风险组或低风险组,其余52%的患者处于中等风险类别,他们的EPE风险范围广泛。对于这些中等风险患者,前列腺特异性膜抗原(PSMA)正电子发射断层扫描/计算机断层扫描(PET/CT)可能提供更精确的EPE风险预测,因为最近的分析表明,将MRI的形态学信息与PET/CT上的PSMA表达模式结合起来具有良好的诊断性能 [26]。这种定制的诊断方法可以向外科医生和患者提供有关肿瘤范围相关手术风险的信息,并帮助确定需要放疗还是手术的高风险患者。最终,这种策略有助于做出更加个性化的癌症治疗决策。
本研究存在一些局限性。回顾性、单中心的研究设计固有地存在选择偏差,限制了研究结果的普遍性。与之前的观察结果相比,我们的样本中GG ≥ 3的PCa患病率较高,这可能是由于不同医疗机构采用的治疗方案不同 [3,4,5,7]。此外,我们的rEPE显示出非常高的PPV,这可能是由于EPE发生率较高(33.8% vs Mehralivand等人中的22.6% [7]),导致人群中的预检测概率增加,即使敏感性和特异性保持相似,PPV也会相应提高。另外,两名放射科医生在两位专家的监督下一致评估了rEPE分级,这可能减少了错误的3级分级。未来的研究应重点验证所提出的决策工具在多个中心的可重复性和适用性。
总之,本研究强调了使用MRI衍生的标志物(rEPE分级和PSAD)进行前列腺癌局部分期的重要性。特别是,我们开发的决策工具结合了这两个MRI标志物和活检中的肿瘤分级,能够识别出高风险和低风险的EPE患者。因此,该决策工具可能有助于提高治疗决策的合理性,并为PCA患者制定个性化的治疗计划。