**摘要**
**背景**
质量调整生命年(QALYs)是健康技术评估中常用的健康效益衡量指标。由于某些司法管辖区对QALYs使用的法律和政策限制,人们提出了替代性结果指标,如等值生命年和总健康年。然而,关于这些替代指标在应用于常见健康经济模型结构时的表现,目前的研究还较为有限。
**方法**
我们使用了三个简化的肿瘤经济学模型,这些模型反映了已发表的成本效益分析的典型特征,来研究替代性结果指标如何重新表达相同的生存期和健康相关生活质量输入。我们比较了基于QALYs的结果与基于生命年、等值生命年和总健康年的结果,这些指标分别用于肾细胞癌、慢性髓性白血病和非小细胞肺癌的评估。
**结果**
总健康年的增量始终大于QALYs的增量(高出13-46%)。生命年与QALYs之间的关系因疾病类型而异(从低63%到高43%不等)。
**结论**
当应用于相同的模型输入时,替代性结果指标主要是在重新表达现有信息,而不是纳入额外的健康效益维度。与QALYs相比的差异反映了生存期和健康相关生活质量效应的不同权重,并取决于这些组成部分之间的平衡。这些发现强调了在经济学评估中同时使用QALYs和替代性指标时需要谨慎解释。
**关键词**
本研究使用经济模型比较了不同的健康效益指标,包括质量调整生命年(QALYs)、等值生命年和总健康年。总健康年始终显示出比QALYs更高的治疗效益,而等值生命年通常与QALYs较为接近。虽然可以同时报告等值生命年和总健康年等替代性结果指标,但由于其计算方法的不同,需要谨慎解读。
**引言**
在健康技术评估(HTA)中,量化干预措施健康效益的基本指标是预期生命年(LYs),即与替代方案相比的生存年数。然而,这种方法没有考虑这些生命年期间的健康相关生活质量(HRQOL),因此在HRQOL有显著影响的情况下,使用LYs是不够的。为此,人们提出了质量调整生命年(QALY)这一指标,它将预期寿命和HRQOL整合为一个单一的衡量标准[1]。当时认为,这种一维的衡量方法比保留多个维度更易于使用[2]。结合代表QALY“影子价格”的“阈值”[3],QALYs提供了一种简单的干预措施效率评估方法,并为成本效益决策提供了依据。但从一开始,QALY就存在方法学上的问题。为了实现其简单性,支持者不得不做出三个他们认为有问题的假设[4],这些假设已被证明是不可持续的[5],因此有人提出了一个新的方法来放宽这些假设[6]。除了QALY本身的方法学问题外,还有人质疑所有QALYs都具有同等价值这一核心观点,无论它们是在何种情况下获得的[7]。这意味着没有考虑到基础疾病的严重程度,尽管大多数受访者认为应该考虑这一点——例如,患有严重疾病的人获得的QALY应该比患有轻微疾病的人获得的QALY更有价值[8]。为了解决这个问题,一些HTA机构对其QALY的价值进行了调整,以偏爱用于更严重疾病的治疗[9]。同样,QALY也没有考虑到决策者可能认为相关的社会经济状况或其他因素[10]。为了缓解这些分配问题,一些研究人员开发了其他健康效益衡量指标,如等值生命年(evLYs)[11]和总健康年(HYT)框架[12]。等值生命年对生命延长期赋予了统一的人口效用权重,而其他方面则依赖于与QALY相同的生存期和HRQOL输入。因此,evLYs与QALYs的主要区别在于生存期增益的权重方式,而不是用于计算结果的信息[11, 13]。HYT指标将每种治疗的LYs、QALYs和“反事实QALYs”加总起来[12];这些反事实QALYs适用于除生存期最长治疗之外的所有治疗,并在原始HYT框架定义的观察生存期之后继续累积[12]。本研究的目的是展示替代性结果指标在应用于相同生存期和HRQOL输入时的表现。通过使用三个反映已发表成本效益分析典型特征的简化肿瘤经济学模型,我们比较了基于QALYs的结果与基于LYs、evLYs和HYTs的结果。我们的目的不是评估特定干预措施的成本效益或评估替代性指标的政策适用性,而是提供方法学上的说明,展示这些指标在典型HTA建模条件下的差异。
**方法**
2.1 模型结构
模型结构和输入的选择反映了已发表的肿瘤成本效益分析的常见特征,同时避免了依赖或复制任何特定的先前发表的评估结果。这种方法允许研究替代性指标(如evLYs和HYTs)如何机械地重新表达相同的生存期和HRQOL输入,而不受产品特定或政策考虑的影响。我们使用了三种肿瘤疾病的健康经济模型进行这些分析:肾细胞癌(RCC)、慢性髓性白血病(CML)和非小细胞肺癌(NSCLC)。选择这些疾病是因为许多新型治疗方法都经常接受HTA评估。了解使用不同指标时的经济评估变化是相关的。选择这些疾病部分是因为它们具有不同的进展情况、HRQOL和生存率,从而可以评估预期寿命对不同健康结果指标的影响。在这三种疾病中,CML的预后最好,5年生存概率高达90%[14],其次是RCC,5年生存概率为10-40%[15],NSCLC的5年生存率低于10%[16]。此外,每个模型都比较了一个示例性干预措施和一个对照组,以便计算增量结果。我们采用了三状态分割生存模型,包括无进展(PF)、疾病进展(PD)和死亡。总体生存曲线用于将患者分为存活和死亡状态。PF生存曲线用于将存活者分为PF和PD状态。NSCLC的生命周期范围为20年,CML和NSCLC为42年;CML和NSCLC模型中的周期长度为1个月,RCC模型为1周。所有成本和结果均应用了3%的年折现率(表1)。本研究中评估的所有结果指标都基于相同的生存期和效用输入,确保不同指标之间的差异反映了不同的权重约定,而不是模型临床结果的差异。
**输入**
表1中的输入是为本分析设计的假设值,但它们反映了这些疾病领域实际临床场景中的典型成本和结果。有效性输入被指定为生成与常见肿瘤建模实践一致的生存曲线,并足以说明不同结果指标之间的差异。这些输入并非旨在复制任何特定的临床试验或干预措施。成本类别包括药物(即获取和给药)、PF和PD状态下的疾病管理、后续治疗和生命终结(表1)。CML和NSCLC模型中的效用基于健康状态,并因干预措施和对照组而异;而在RCC模型中,效用是基于死亡时间的。所有结果指标均应用了统一的效用值,没有为了反映不同的估值观点而进行调整。
**模型结果**
模型结果包括每种治疗选项的总成本、QALYs、LYs、evLYs和HYTs。这些用于计算与每种结果指标相关的增量成本和效益。本研究中评估的所有结果指标都基于相同的生存期和HRQOL输入,差异仅来源于每种指标使用的不同聚合和权重约定。
**结论**
本节报告了不同替代性结果指标的绝对和增量结果,并在讨论部分提供了对观察到的差异的解释。按疾病和结果指标划分的绝对健康结果见表2,增量结果见图1。相对于对照组,RCC的增量LYs增加了83%,CML为6%(图1)。图2显示了与增量QALYs相比的增量LYs、evLYs和HYTs的相对变化。图3以图形方式展示了CML和NSCLC模型的HYTs计算过程;由于RCC模型使用了死亡时间效用方法,因此无法为其提供类似的图形表示。表2 根据所使用指标的绝对健康效益
全尺寸表格
图1:该图像的替代文本可能是使用AI生成的。
全尺寸图像
使用替代指标的增量健康效益:CML(慢性髓性白血病),evLYs(等值生命年);HYT(总健康年);NSCLC(非小细胞肺癌),QALYs(质量调整生命年);RCC(肾细胞癌)
图2:该图像的替代文本可能是使用AI生成的。
全尺寸图像
增量效益的相对变化:CML(慢性髓性白血病),evLYs(等值生命年);HYT(总健康年);NSCLC(非小细胞肺癌),QALYs(质量调整生命年);RCC(肾细胞癌)
图3:该图像的替代文本可能是使用AI生成的。
全尺寸图像
生命年(LYs)、质量调整生命年(QALYs)及其对等值生命年(evLYs)和总健康年(HYTs)影响的图形表示。注意:对于肾细胞癌指标,QALYs是使用死亡时间效用权重计算的。因此,无法分别呈现无进展(PF)和进展性疾病(PD)状态下的QALYs、evLYs和HYTs。在HYT计算中,橙色高亮区域代表“反事实QALYs”(即如果患者接受干预措施,他们本可以获得的额外效益)。
CML(慢性髓性白血病)、NSCLC(非小细胞肺癌)
在所有指标中,每增加一个HYT所对应的增量成本都低于使用其他结果指标计算的成本。然而,每增加一个HYT的增量成本与其他成本效益分析结果相似,当与设定的阈值$34,000/HYT和$89,000/HYT相比时,分别对应于成本效益分析的阈值$50,000/QALY和$150,000/QALY [12]。表3报告了每增加一个evLY和每个HYT的增量成本相对于每增加一个QALY的增量成本的百分比变化,这些变化与增量evLY和HYT结果中的相对差异相对应。对于CML模型,每增加一个LY的增量成本高于使用其他结果指标计算的成本。
表3:每增加一个健康效益的增量成本变化
使用替代结果指标计算的增量成本效益比率显示在图4和表3中。
图4:该图像的替代文本可能是使用AI生成的。
全尺寸图像
每增加一个健康效益的增量成本*:CML(慢性髓性白血病),evLY(等值生命年);HYT(总健康年);NSCLC(非小细胞肺癌),QALY(质量调整生命年);RCC(肾细胞癌);$34,000/HYT和$89,000/HYT的阈值分别对应于成本效益分析的阈值$50,000/QALY和$150,000/QALY [4]
4. 讨论
质量调整生命年已成为许多健康技术评估(HTA)过程中常用的健康效益衡量标准。针对其分配属性和相关法律障碍的批评,引入了替代指标,如evLYs和HYTs。本研究探讨了这些替代指标在三种肿瘤学指标背景下对成本-效用分析各组成部分的影响。
质量调整生命年可以针对个别治疗进行计算,并在同一指标内、同一治疗领域内或不同治疗领域之间进行比较。相比之下,evLYs和HYTs是相对于特定的对照治疗定义的,因此设计上仅将一种治疗与其他同一指标内的治疗进行比较。因此,这些替代指标仅限于指标内的比较。
在所有三个模型中,对照治疗的evLYs和QALYs在数值上是相同的,而干预治疗的evLYs略高于QALYs。这反映了evLY指标的构建方式,即对生存延长期应用统一的人口效用值。增量HYTs高于增量QALYs(高出13-46%),不同指标之间的差异也有所不同。CML指标的增量HYTs与增量QALYs的比率最低,而NSCLC指标的比率较高。总体而言,在三个模型中,增量evLYs与增量QALYs紧密一致,增量HYTs与增量LYs也紧密一致,除了CML指标,其中增量LYs低于增量QALYs。与QALYs一样,evLYs和HYTs的计算取决于生存延长和HRQOL(健康相关生活质量)输入。图3显示,处于无进展(PF)和进展性疾病(PD)状态的时间比例及其相关效用值会影响不同指标的结果计算。先前的研究也报告了类似观察结果,包括一项心血管疾病药物的成本效益分析 [17],以及一项评估使用QALYs、evLYs和HYTs计算增量成本效益差异和相似性的研究 [18]。
文献中讨论了替代结果指标,以解决QALYs的特定问题 [19]。例如,通过为生存延长分配一个统一的价值,evLYs改变了应用于不同人群的HRQOL差异的权重。在评估非酒精性脂肪性肝炎的治疗方法时,Zemojdzin等人报告了使用QALYs与evLYs时成本效益结果的差异 [20]。DiStefano等人同样指出,针对QALYs的批评提出了替代健康效益指标,但结论是没有任何单一指标能够解决所有概念性问题 [19]。
对于主要改善HRQOL而不影响预期寿命的治疗,如偏头痛、抑郁症、脱发和眼病,使用evLYs的分析得出的结果与使用QALYs的结果相似 [21]。相反,对于延长生存期的治疗,特别是在额外生存期内的HRQOL较低时,evLYs可能与QALYs不同,例如在镰状细胞病基因疗法的评估中 [22]。这些模式突显了不同结果指标中生存和生活质量输入的加权方式差异。
Paulden等人 [23] 指出,HYT框架下的治疗排名可能会根据评估的替代方案集而变化,因为HYTs取决于各治疗观察到的最大生存期。此外,HYT框架中使用反事实QALYs是基于患者即使未接受该治疗也会获得的生存价值进行估值的 [23]。无论使用哪种效益指标,经济评估都需要为该效益的一个单位确定一个影子价格(成本效益阈值)[3]。这已被证明非常困难 [24],目前仍缺乏确定QALY或LY影子价格的充分证据 [25]。例如,英国曾专门努力基于弹性数据估计这一影子价格 [26]。该研究表明,不同治疗领域的QALY增益的实证边际成本效益存在巨大差异(从呼吸系统疾病的不到2000英镑到母婴护理的近300万英镑 [附录C中的表C76])。由于缺乏理论基础,提出的修订后的加权平均价格未被国家健康与护理卓越研究所采纳。其他国家也进行了类似但不那么全面的努力 [27,28,29,30],但大多仍停留在学术层面 [31]。
在一些国家,通过提高阈值来增加对严重疾病的重视,以解决相关问题 [32]。例如,英格兰的国家健康与护理卓越研究所根据绝对和相对QALY缺口应用了1.2或1.7的严重程度修正因子。虽然这些修正因子反映了社会对优先考虑严重疾病的偏好判断,但其校准——如同阈值设定本身一样——涉及超出纯粹经验考虑的自主选择。
改变效益指标意味着需要重新考虑影子价格,因为没有理论依据认为它与QALY的影子价格相同。鉴于不同分析中的相对效应比例不同,没有理由应用简单的“校正因子”。更一般地说,成本效益阈值的设定在方法上具有挑战性,涉及经验估计和规范判断。Basu等人 [12] 指出,采用HYTs需要重新调整阈值以反映其加法构建产生的系统较大增量值。对于evLYs,是否可以采用类似的重新校准方法仍是一个未解决的问题。
本研究有几个局限性,这些局限性反映了有意的设计选择。分析基于三个简化的肿瘤学模型,旨在允许在共同的卫生经济建模结构下比较不同的结果指标,而不是评估特定干预措施的成本效益。尽管指标数量有限,但这些模型涵盖了广泛的临床背景,包括预后、生存收益和HRQOL的显著差异。这种方法旨在尽可能广泛,同时保持模型间的可比性,利用指标间的差异来突出结果指标如何转换相同输入的共性模式。
所有示例均来自肿瘤学领域,其中生存与生活质量之间的权衡尤为明显;在死亡率影响较小或主要带来生活质量改善的治疗领域,或者治疗主要改善特定生活质量领域但通用偏好工具无法充分捕捉的情况下,结果可能会有所不同。此外,分析并未试图为替代结果指标建立或应用成本效益阈值。因此,研究结果应被视为说明替代指标的行为和解释,而不是作为报销、定价或政策决策的指导。
总体而言,研究结果说明了替代结果指标如何将相同的模型输入转化为不同的总结指标,强调了在解释结果时理解其构建方式的重要性。
5. 结论
在这项说明性分析中,当应用于相同的生存和HRQOL输入时,替代结果指标得出的健康效益估计值存在数值差异。增量evLYs通常与增量QALYs相似,而由于构建方式的不同,增量HYTs始终较大。这些差异反映了应用于相同基础模型输入的替代加权惯例,而不是纳入了额外的健康效益维度。因此,当与QALYs一起使用时,替代结果指标需要在特定的建模背景下仔细解释。理解这些指标的构建方式对于解释结果差异以及评估其在经济评估中的作用至关重要。