肺孤立性结节恶性风险联合预测模型研究:融合Brock、Mayo与PKUPH模型以提升肺癌筛查效能

时间:2026年4月1日
来源:Holistic Integrative Oncology

编辑推荐:

本文旨在解决现有肺孤立性结节(SPN)恶性风险预测模型在应用于中国肺癌筛查人群时,因人群分布偏移和校准问题导致的性能不足。为此,研究者整合了Brock、Mayo和PKUPH这三个经典模型,构建了联合SPNs模型。研究结果显示,该联合模型在训练集和验证集中均表现出优异的区分度(AUROC分别达0.87和0.86)和临床净获益,实现了高、中、低三级的风险分层,为临床决策提供了更准确、可靠的预测工具。

广告
   X   

随着低剂量计算机断层扫描(LDCT)在肺癌筛查中的广泛应用,被意外检出的肺孤立性结节(SPN)越来越常见。然而,绝大多数SPN是良性的,这带来了广泛的过度诊断和患者焦虑。因此,准确区分良恶性结节对于提高肺癌筛查效率至关重要。当前,临床实践依赖Brock、Mayo和PKUPH等风险预测模型来评估SPN的恶性概率,但这些模型各有局限:Brock模型虽为筛查人群设计,但基于西方人群;Mayo模型则源于临床患者而非筛查人群,且部分数据来自胸部X光;PKUPH模型虽针对中国人开发,但同样基于临床患者,且是病例对照研究。当这些模型应用于中国肺癌筛查这一新的人群时,常面临分布外泛化性能下降和需要重新校准的挑战。在此背景下,研究者思考:与其纠结于选择哪个单一模型,能否“博采众长”,将这几个经典模型结合起来,形成一个更强大、更稳健的预测工具?
本研究正是为了回答这个问题而展开。研究人员从重庆大学附属重庆医院的健康管理中心,纳入了2018年至2019年间确诊的SPN患者,最终共纳入662名受试者。他们前瞻性与回顾性随访相结合,以明确SPN的结局(恶性或良性)。研究的关键创新在于,采用加权平均法,将Brock、Mayo和PKUPH三个模型的风险评分进行整合,构建了一个“联合SPNs模型”。赋予Brock模型权重为4,Mayo和PKUPH模型权重各为3,旨在让预测误差方差更小的模型在最终决策中拥有更大话语权。为了评估这个“联合舰队”的战斗力,研究团队使用了受试者工作特征(ROC)曲线、精准率-召回率(PR)曲线、决策曲线分析和Hosmer–Lemeshow检验等一系列“标尺”,在训练集和验证集中,将联合模型与三个“单兵作战”的模型进行了全方位比较。
研究结果显示,这个联合模型确实不负众望。在区分良恶性结节的能力上,联合模型在训练集的曲线下面积(AUROC)达到0.87,验证集为0.86,表现均优于最佳的单个模型(Brock模型,训练集AUROC 0.85,验证集0.83)。在分类性能上,面对恶性结节占少数(本研究恶性率为13.90%)的不平衡数据集,联合模型的精准率-召回率曲线下面积(AUPRC)也最高。更重要的临床实用性体现在决策曲线分析上,联合模型在整个阈值概率范围内都展现出比任何单个模型更高的“净获益”,这意味着使用该模型指导临床决策(如是否进行活检或手术),能为患者带来更大的临床利益。此外,所有模型都显示出良好的校准度。基于训练集数据,研究者为联合模型设定了风险分层阈值(0.03和0.11),将SPN分为高、中、低风险三级。在验证集中,这三类的恶性概率分别为62.50%、16.67%和3.49%,为后续的风险分层管理提供了清晰的量化依据。文章还通过两个具体病例说明了联合模型如何综合不同模型的意见,做出更合理的风险判断。
在讨论和结论部分,作者强调,这项研究为解决现有预测模型应用于新人群时面临的模型选择、重新校准和分布外泛化等实际障碍,提供了一个可行的方案。联合模型通过整合不同模型的优势信息,不仅提升了预测准确性,还增强了模型的稳健性和泛化能力。它能够对SPN进行有效的多级风险分层,从而在临床实践中,帮助医生为高风险患者建议更积极的诊断(如短期随访、PET-CT或活检),为低风险患者避免不必要的侵入性检查和焦虑,实现肺癌筛查的精准化管理。尽管本研究仅进行了内部验证,且加权方法较为简单,未来需要在更多样化的数据集上进行外部验证,并探索更优化的权重确定算法(如遗传算法),但这项研究无疑为提升肺癌筛查和SPN管理的效能,迈出了坚实而富有启发性的一步。该研究发表于《Holistic Integrative Oncology》期刊。
为开展此项研究,作者主要应用了以下关键技术方法:研究队列来源于2018年至2019年在重庆大学附属重庆医院健康管理中心进行常规体检并被诊断为SPN的患者。通过前瞻性与回顾性随访相结合的方式确定结节的良恶性结局。使用LDCT进行影像学检测,并由资深放射科医师在人工智能软件辅助下评估结节特征。核心建模方法是采用加权平均法,整合Brock、Mayo和PKUPH三个经典模型的风险评分以构建联合SPNs模型。模型性能通过ROC曲线、PR曲线、决策曲线分析以及Hosmer–Lemeshow检验和校准曲线进行评估。
研究结果
3.1 患者临床与影像学参数
共纳入662名受试者,总体恶性率为13.90%。患者被按8:2的比例随机分为训练集和验证集。在两组中,年龄较大、有癌症病史、结节直径较大、位于上叶、边界不清及有毛刺征等特征均与恶性显著相关。
3.2 预测模型性能比较
在区分能力方面,联合SPNs模型在训练集的AUROC为0.87,验证集为0.86,均优于三个单一模型(Brock模型分别为0.85和0.83;Mayo模型为0.81和0.82;PKUPH模型为0.81和0.79)。在分类性能上,联合模型在训练集和验证集的AUPRC(分别为0.62和0.51)也最高。
3.3 临床效用与校准
决策曲线分析显示,所有模型均具临床效用,而联合模型在训练集和验证集中均展现出比任一单一模型更高的净获益。Hosmer–Lemeshow检验表明所有模型校准良好(p > 0.1)。联合模型的校准曲线在训练集和验证集中均紧密贴合对角线。
3.4 最佳阈值与恶性分布
基于训练集确定了各模型的最佳风险分层阈值。对于联合SPNs模型,阈值定为0.03和0.11。在验证集中,联合模型划分的低、中、高风险等级的恶性概率分别为3.49%、16.67%和62.50%。
研究结论与意义
本研究成功开发并验证了一个整合Brock、Mayo和PKUPH模型的联合SPNs模型。该模型在中国肺癌筛查人群的队列中证明,其预测性能(包括区分度、分类能力和临床净获益)优于任一被整合的单一模型,并且具有良好校准度。联合模型通过聚合不同模型互补的预测信息,有效克服了单一模型可能存在的局限性(如人群特异性、数据来源差异),提升了预测的准确性与稳健性。
该研究的重要意义在于,为解决现有预测模型在应用于新目标人群(如中国肺癌筛查人群)时面临的模型选择困难、需重新校准及分布外泛化性能下降等实际障碍,提供了一个行之有效的方案。通过将SPN划分为高、中、低三个风险等级,并为每个等级提供了明确的恶性概率估计(如验证集中高风险概率达62.50%,低风险仅3.49%),该模型为临床医生实施风险分层管理提供了量化依据。例如,可据此为高风险患者建议更积极的诊断干预,而为低风险患者制定更长期的随访计划,从而在确保恶性病变早期诊断的同时,最大限度地减少对良性结节的不必要检查和治疗,优化肺癌筛查的效益与资源配置。尽管未来仍需在更广泛的人群中进行外部验证,并探索更先进的权重确定算法,但本研究提出的模型整合策略,为提升预测模型在真实世界临床实践中的可用性和可靠性指明了有前景的方向。

生物通微信公众号
微信
新浪微博


生物通 版权所有