综述:乳腺癌筛查策略的健康经济学评价:一项聚焦方法与质量评估的系统综述

时间:2026年5月30日
来源:Applied Health Economics and Health Policy

编辑推荐:

背景:乳腺癌筛查对早期发现和改善健康结局至关重要,但需可靠的健康经济学评价以指导实施。本系统综述旨在检验筛查策略健康经济学评价的方法学、质量与结果,以支持决策制定与未来研究。 方法:研究人员在PubMed、Embase、Web of Science、EconL

广告
   X   

背景:乳腺癌筛查对早期发现和改善健康结局至关重要,但需可靠的健康经济学评价以指导实施。本系统综述旨在检验筛查策略健康经济学评价的方法学、质量与结果,以支持决策制定与未来研究。 方法:研究人员在PubMed、Embase、Web of Science、EconLit及卫生技术评估(HTA)数据库中开展文献检索,纳入采用影像学模式的乳腺癌筛查健康经济学评价,由两名研究者独立筛选。提取研究设计、筛查策略与结局数据并进行合成。模型类研究采用国际药物经济学与结果研究学会(ISPOR)清单评价质量,实证数据类研究采用卫生经济学共识标准扩展版(CHEC-extended)清单评价质量。所有结果通过交互式平台和开放科学框架(OSF)公开,形成支持透明性、复用性与更新的开放资源。 结果:综述共纳入128项研究,含96项模型类研究、14项实证数据类研究、15项结合实证数据与模型外推的研究,以及3项方法不明的研究。微模拟(microsimulation)与队列模拟(cohort simulation)分别用于47项和53项研究。增量成本效益比(ICER)随筛查模式、风险因素、筛查年龄范围及筛查间隔差异存在广泛异质性。多数研究显示,与不筛查相比,乳腺X线摄影(mammography)具有成本效果,但部分研究提示其在平均风险女性、40–49岁年轻人群或年度筛查场景中不具备成本效果。超声(ultrasound)筛查在平均风险女性中总体较不筛查更具成本效果。乳腺X线摄影联合磁共振成像(MRI)在致密乳腺且有乳腺癌或卵巢癌家族史的女性中通常具有成本效果,但在既往接受过放射治疗的人群中不具备成本效果。模型类研究的中位质量得分为55%,其中微模拟质量高于队列模拟;含外推与不含外推的实证数据类研究中位质量得分均为65%。 结论:与不筛查相比,乳腺X线摄影通常被报告为具有成本效果。根据对照策略、风险因素、年龄范围及筛查间隔的不同,乳腺X线摄影联合超声和/或MRI可能具备成本效果。已发表的健康经济学评价普遍存在质量欠佳问题,未来研究应优先提升整体质量,尤其关注数据、验证与报告环节。
引言
乳腺癌是全球女性最常见诊断癌症及癌症相关发病与死亡的首要原因,2022年全球新发病例230万例,死亡67万例。乳腺癌筛查旨在通过早期发现降低死亡率,随机试验与证据合成显示,最广泛使用的筛查模式——乳腺X线摄影可能降低乳腺癌死亡率,但效应量在不同系统综述与方法学评估中存在差异。除乳腺X线摄影外,数字乳腺断层合成、热成像、乳腺X线摄影联合超声或MRI等新兴技术与多模式组合也在检测效能上显示出潜力。然而,将这些策略纳入大规模项目需同时考量健康影响与经济影响,例如乳腺X线摄影联合MRI虽提高检出率,但也因更高的假阳性率带来过度诊断与过度治疗风险,且MRI成本显著高于乳腺X线摄影,进一步增加了策略比较的复杂性。在此背景下,健康经济学评价通过将临床结局与成本参数整合为单一指标,在识别目标人群最优筛查方案、支撑循证决策中发挥关键作用。为实现可信且相关的研究结果,乳腺癌筛查健康经济学评价需采用适宜的方法学路径并保障高质量。根据数据可得性与决策问题,评价可分为实证数据类、模型类或二者结合;实证数据类分析依托临床试验或观察性研究估计短期结局,而模型类评价常需通过多源信息合成来评估长期成本与健康获益。在模型类路径中,模型类型选择会显著影响分析结果,状态转移模型与离散事件模拟因可动态表征疾病进展而被广泛用于癌症筛查;微模拟与队列模拟等不同分析路径也会对结果产生影响。现有系统综述多聚焦于特定国家、人群、筛查模式或风险分组,或仅纳入模型类研究,且常缺乏对方法学与质量评估的细节提取,限制了证据的广泛复用与综合解读。因此,本研究旨在系统综述并评估乳腺癌筛查策略健康经济学评价的方法学、质量与结果,不设语言、国家、人群、筛查模式与结局限制,并将所有中间产出与结果通过交互式平台与OSF仓库公开,形成支持透明、复用与更新的开放资源。
方法
本研究遵循PROSPERO注册方案(编号CRD42023423840),并按PRISMA 2020声明报告。纳入标准为针对女性乳腺癌筛查的完整健康经济学评价,干预措施涵盖临床乳腺检查与影像学筛查模式。检索数据库包括MEDLINE(PubMed)、Embase、Web of Science、EconLit与国际HTA数据库,检索时限为2013年至2025年,不限制语言;预2013年文献已被既往综述覆盖,故未重复纳入。检索策略围绕乳腺癌、筛查、健康经济学评价三个概念构建,包含医学主题词(MeSH)与题摘文本词,并通过追溯纳入文献参考文献补充潜在相关研究。研究筛选与数据管理通过Pitts软件与Zotero工具完成,去重后由两名研究者独立完成题摘筛选与全文筛选,分歧通过讨论或由第三位研究者仲裁解决;非英文文献通过人工智能翻译平台转为英文,并由母语使用者核查准确性。数据提取采用标准化表单,经预测试后由单名研究者完成,不确定内容经讨论确认;提取内容包括研究基本信息、经济学评价细节(设计、视角、时间范围、场景、贴现率)、输入数据、结局与不确定性评估,对模型类分析额外提取模型结构、类型、健康状态与周期长度。证据合成阶段,按模型类型与分析路径分层描述人群特征、筛查模式、方法学特征与质量评估结果;由于模型类与实证数据类研究采用不同质量评估工具,二者得分不直接比较。健康经济结局统一调整为2026年美元价,缺失价格年份、国家或货币信息的研究被排除在经济比较之外;成本效果结论依据原研究报告的支付意愿阈值判定,未明确阈值的研究不赋值。此外,研究还分析了筛查参与率(uptake)与依从性(adherence)对经济结果的影响。质量评估中,模型类研究采用修订版ISPOR清单,实证数据类及混合方法研究采用CHEC-extended清单,评分按“是=1,否=0”计算百分比,并由两名研究者独立完成评估与核对。最后,研究人员开发了基于R Shiny的交互式开放平台,支持按出版时段、语言、评价类型、研究设计、模型类型与分析路径自定义筛选,并以表格与图形展示健康经济结局与质量信息;所有研究资料同步公开于OSF平台(项目编号https://doi.org/10.17605/OSF.IO/V6W9A)。
结果
文献检索共获得6323条记录,去重后4429篇进入题摘筛选,排除4169篇,剩余260篇进入全文筛选,最终纳入128篇研究,覆盖36个国家,以美国、荷兰、中国来源最多。人群层面,84项研究针对平均风险女性,其余针对致密乳腺、乳腺癌或卵巢癌家族史、基因突变及其他风险分层;筛查起始年龄多为40–49岁或50–59岁,终止年龄多为70–79岁或60–69岁。筛查模式层面,乳腺X线摄影单独或联合其他模式为最常用干预(109项)与对照(76项),无筛查作为对照出现于75项研究,MRI、超声、断层合成等其他模式评估较少。研究设计层面,模型类占96项,实证数据类占14项,混合类占15项;成本效用分析(62项)与成本效果分析(42项)为主流,少数采用成本后果分析。模型类型层面,状态转移模型最常见(35项),其次为离散事件模拟(14项)与自然史模型(13项),19项未明确报告模型类型;分析路径以队列模拟(53项)与微模拟(47项)为主。时间范围层面,模型类与混合类多采用终身视角,实证数据类多采用1–5年短期视角;研究视角以医疗部门最为常见,其次为支付方、社会与患者视角。
健康经济结果显示,ICER分布范围极广,从负成本节约至无穷大,按质量调整生命年(QALY)计算的ICER中位数为38 805美元/每QALY(95%CI:负值至849 081美元),按寿命年(LY)计算的ICER中位数为14 267美元/每LY(95%CI:负值至2 916 708美元)。分层分析显示:乳腺X线摄影在多数人群中较不筛查更具成本效果,但在平均风险女性的40–49岁起始筛查或年度筛查场景中,约20项研究提示其不具备成本效果。超声筛查在平均风险女性中总体更具成本效果,但在致密乳腺人群中的成本效果结论存在差异。MRI仅在高风险人群或平均风险人群的第二轮筛查中应用,在致密乳腺或有乳腺癌/卵巢癌家族史的女性中通常较乳腺X线摄影更具成本效果,但在既往接受胸部放射治疗的儿童癌症幸存者等人群中,年轻起始(25–30岁)的MRI筛查不具备成本效果。参与率与依从性分析显示,参与率升高会轻微推高ICER但不改变成本效果结论,却显著提升健康获益;依从性升高则同时提升健康获益与成本,ICER保持稳定或小幅下降,即使依从性从完全依从降至部分依从,仍不改变总体成本效果判定。人工智能(AI)辅助筛查的4项模型研究显示,AI作为阅片辅助、替代第二阅片人或用于风险分层筛查,在多国常规乳腺X线摄影项目中可能具备成本效果甚至成本节约,但结果对AI性能、成本与实施模式假设高度敏感,仍需实证数据降低不确定性。
质量评估显示,模型类研究平均质量得分52%,中位数55%;微模拟在模型验证、设计与结果解读维度表现优于队列模拟,总分更高(57% vs 50%),队列模拟在数据、分析与利益冲突披露维度略优。按模型类型分层,状态转移模型与自然史模型质量最高(中位数60%),离散事件模拟、组合模型与其他模型质量较低(中位数50%)。实证数据类研究中位质量得分65%,方法不明研究仅30%。高质量模型类研究的共性特征为采用终身时间范围、应用贴现率、同时开展确定性与概率敏感性分析,且以状态转移微模拟为主要路径;唯一满分研究同时满足上述特征,并完成全面验证与详细报告。低质量研究普遍存在验证不完整、数据适配性不足、报告缺失等问题,缺乏面部效度、内部与外部验证记录,且技术细节不足以支撑复现。
讨论
本研究纳入128项全球乳腺癌筛查健康经济学评价,证实乳腺X线摄影仍为最成熟且证据最充分的筛查模式,其成本效果特征与当前欧美临床推荐一致。超声筛查的成本效果优势提示其在乳腺X线摄影不可及的低资源场景具备应用潜力;乳腺X线摄影联合MRI在致密乳腺人群中的良好成本效果与强临床证据,可为政策制定者将这一组合纳入高危人群筛查策略提供依据。方法学层面,近年状态转移模型逐渐取代早期的离散事件模拟成为主流,反映了对模型简洁性与透明度的偏好;微模拟虽在早期研究中占主导,但近年队列模拟应用增多,体现了简单性与复杂性的权衡。研究同时指出,单一实证数据类评价的短期时间范围与长期结局测量不匹配,违反了CHEC-extended清单的核心建议。本综述的优势在于严格遵循FAIR原则,通过开放平台与OSF仓库实现证据的透明、可复用与可持续更新,检索策略兼顾广度与精度,纳入研究数量超过既往同类综述,且首次系统整合了方法学特征与质量评估结果。局限性在于数据提取与质量评估由单名研究者完成,虽通过多步校验缓解偏倚,但仍无法完全排除个体判断误差。研究结果为政策制定提供了可直接调用的证据库,也为未来研究指明了方向:应根据结局需求选择实证或模型路径,长期结局必须引入模型外推并充分量化不确定性;优先推荐状态转移微模拟作为核心建模方法,也可通过多模型比较增强稳健性;需严格遵循AdViSHE清单开展模型验证,按CHEERS声明规范报告,并参考本综述修订的ISPOR与CHEC-extended清单开展质量自评,以提升乳腺癌筛查健康经济学评价的整体可信度与应用价值。
结论
本系统综述表明,乳腺X线摄影是最广泛评估的筛查模式,且较不筛查通常具备成本效果;联合超声和/或MRI的成本效果取决于对照策略、风险因素、年龄范围与筛查间隔。方法学层面从离散事件模拟向状态转移模型的转变,以及多种分析路径的应用,标志着该领域的持续进步。但已发表研究整体质量欠佳,未来需重点提升数据质量、模型验证与报告透明度。本研究开发的交互式平台可有效支持用户对纳入研究的访问与分析,为循证决策与后续研究提供扎实的证据基础。

生物通微信公众号
微信
新浪微博


生物通 版权所有