背景:重症监护病房(ICU)患者常面临长期躯体与心理功能损害,导致健康相关生活质量(HRQoL)下降。非药物干预(NPI)的应用日益广泛,但其相对有效性仍不明确。
目的:遵循PICOS框架与PRISMA-NMA指南,通过网状Meta分析(NMA)系统评价改善ICU患者HRQoL的非药物干预措施。
设计:本研究为系统评价与网状Meta分析,研究方案已在PROSPERO平台预注册(注册号CRD42024626250)。
方法:研究人员检索了PubMed、Embase、Cochrane Library、Web of Science及EBSCO数据库截至2024年11月的文献,纳入研究对象为成年ICU患者、对照组为常规护理、安慰剂或其他非药物干预、报告经验证的HRQoL结局指标(SF-36、SF-12或EQ-5D)的随机对照试验(RCT)。由两名研究人员独立完成文献筛选、数据提取及偏倚风险评估。统计分析采用RevMan 5.3与Stata 17.0软件,计算标准化均数差(SMD)及其95%置信区间(CI),并通过累积排序曲线下面积(SUCRA)对各干预措施进行排序。仅纳入已发表的同行评议数据。
结果:共纳入19项RCT(2654例患者,12种非药物干预)。在整体HRQoL方面,ICU日记(SMD:−0.30;95%CI:−0.71~0.10)、认知疗法联合移动应用程序(APP+CT)(SMD:−0.26;95%CI:−0.85~0.33)及电肌肉刺激联合体力活动(EMS+PA)(SMD:−0.06;95%CI:−0.72~0.59)的SUCRA概率最高。在生理成分汇总(PCS)方面,ABCDE集束化策略(SMD:−0.50;95%CI:−1.61~0.60)与结构化体力活动(SMD:0.08;95%CI:−0.89~1.06)排名居前。在心理成分汇总(MCS)方面,ABCDE集束化策略(SMD:−0.43;95%CI:−1.33~0.46)与应用类认知疗法(SMD:−0.18;95%CI:−0.92~0.55)获益可能性最大。然而,所有分析的置信区间均跨越零值,未达统计学显著性;SUCRA排序仅反映相对概率,而非确证的有效性。
结论:本网状Meta分析未发现具有统计学显著优势的干预措施。ICU日记与ABCDE集束化策略显示出最具潜力,但结果需谨慎解读。未来仍需开展高质量、多中心RCT以验证上述结果并评估长期结局。
1 引言
重症监护病房(ICU)患者常面临持续至出院后的并发症,包括肌无力、疼痛、躁动及谵妄,这些后遗症统称为重症后综合征(PICS),可导致患者及其家庭的健康相关生活质量(HRQoL)长期受损。严重脓毒症、急性呼吸窘迫综合征(ARDS)及长期ICU住院患者的HRQoL评分显著低于普通人群,且缺陷可持续至出院后5年。尽管ICU生存率不断提升,但长期功能与心理障碍的负担促使临床关注点转向优化康复与生活质量。康复工作覆盖从ICU入院至出院后恢复的全周期,需在躯体、认知及情感领域实施个体化干预。药物治疗虽常用,但受限于谵妄、依赖性、情绪障碍等不良反应,且成本高昂、疗效不稳定。因此,非药物干预(NPI)——包括物理康复、心理支持、营养策略及数字治疗——作为更安全、更整体的替代方案日益受到重视。尽管单项非药物干预在特定人群中显示出获益,但目前尚缺乏关于何种干预最有效、最适于在不同ICU环境中推广的共识。传统 pairwise Meta分析虽能提供单一干预的洞见,但无法同时对多种非药物干预进行综合比较。网状Meta分析(NMA)通过整合直接与间接证据,可在统一框架下估算所有可用非药物干预的相对有效性,在该领域具有显著优势,尤其适用于干预措施异质性强、头对头试验稀缺的ICU康复场景。本研究系统探讨非药物干预对ICU患者HRQoL的比较影响,采用经验证的多维结局指标与严格的统计建模,并详细报告NMA方法学流程——包括模型结构、多臂试验处理及传递性评估,以提升符合PRISMA-NMA指南的透明度与可重复性。同时,鉴于不同ICU环境的实施可行性与资源需求差异较大,分析亦考量可能影响高排名干预(如ICU日记与ABCDE集束化策略)落地的情境因素,旨在识别最有前景的策略以支持临床决策,并为重症后康复的未来研究提供依据。
2 方法
本研究遵循PICOS框架:研究对象为成年ICU患者;干预措施为任意非药物干预;对照措施为常规护理、安慰剂或其他非药物干预;结局指标为经验证的HRQoL测量工具;研究设计为随机对照试验。报告全程遵循PRISMA-NMA指南,未使用未发表数据,研究方案已在PROSPERO数据库注册(CRD42024626250)。
2.1 文献检索策略
研究人员系统检索上述五大数据库至2024年11月,采用医学主题词(MeSH)、Emtree词及自由词组合,检索词涉及“重症监护病房”“危重病”“康复”“生活质量”。检索过程不设语言限制,但仅纳入全文可获取的英文研究。完整检索式详见补充表S1。
2.2 纳入与排除标准
纳入标准为评估成年(≥18岁)ICU患者的RCT,不限基础疾病、性别、国籍、种族或治疗方式,ICU类型涵盖综合内科、外科、心胸及混合ICU。因报告有限,未按ICU类型进行分层分析。干预措施包括电肌肉刺激(EMS)、营养支持、认知疗法、早期活动、ICU日记或其联合形式。对照组接受安慰剂、常规护理或其他非药物干预。研究必须报告至少一种使用经验证工具(SF-12、SF-36或EQ-5D)测量的HRQoL结局。出于翻译与数据提取可行性考虑,仅纳入英文全文研究。排除重复报告、缺乏完整数据的会议摘要、撤稿文献及未报告相关结局的研究。
2.3 文献筛选与数据提取
初筛使用EndNote X9去重,两名研究人员(YWH与HYL)独立按预设标准评估标题与摘要,分歧通过讨论或由第三位研究人员仲裁解决。数据提取采用Excel标准化表格,涵盖研究标识(第一作者、发表年份、国家、研究设计)、受试者人口学特征(平均年龄、样本量、性别比)、干预与对照措施的详细描述(组成、时机、频率、强度、持续时间)。结局指标提取基线与干预后数据以减少基线差异偏倚。连续变量记录为均数与标准差;若仅报告中位数与四分位距,则使用既定统计公式进行转换。分类变量以事件率表示。若部分结局数据不可获取,则基于初始样本量计算比值估计以保证一致性。所有数据均由两名研究人员独立提取以确保准确性与可重复性。
2.4 偏倚风险评估
采用《Cochrane干预措施系统评价手册》(5.1.0版)评估纳入RCT的方法学质量。两名研究人员独立评价六个领域:随机序列生成、分配隐藏、参与者盲法、结局评估者盲法、结局数据完整性、选择性报告。随机序列生成普遍评为低风险;分配隐藏73.7%为低风险、26.3%为不明确;受非药物干预性质所限,参与者盲法普遍不可行,84.2%为高风险;结局评估者盲法68.4%为低风险、15.8%为不明确、15.8%为高风险;所有研究均报告完整的结局数据;选择性报告94.8%为低风险、5.2%为高风险。鉴于实施偏倚普遍存在,证据总体确定性有限,主观结局如HRQoL易受膨胀影响。结果解读时已充分考虑实施偏倚与检测偏倚的潜在影响。偏倚风险评估可视化图表由RevMan 5.3生成。
2.5 统计分析
所有统计分析使用Stata 17.0完成,采用频率学框架下的网状Meta分析。RevMan 5.3用于pairwise Meta分析,版本报告保持一致。多臂试验通过调整方差分割方法处理共享对照组以避免重复计数。未使用贝叶斯模型,故不适用收敛诊断。所有流程遵循PRISMA-NMA方法学报告标准。首先通过pairwise Meta分析计算效应量,再进行网状Meta分析比较所有非药物干预的相对疗效。绘制证据网络几何图展示治疗比较的结构与连通性:节点代表干预措施,边代表纳入RCT的直接比较,边厚度与贡献研究的多少成正比。通过评估研究人群(年龄、基线严重程度、ICU类型)、干预特征(时机、持续时间、组成)及潜在效应修饰因子的分布,验证传递性假设。关键效应修饰因子(ICU类型、患者病情严重程度、干预强度、随访时长)在各试验中大体可比,支持间接比较的有效性。采用I2统计量评估研究间异质性,I2≤50%时使用固定效应模型,否则使用随机效应模型。因纳入研究使用不同HRQoL工具,采用标准化均数差(SMD)合并数据,但SMD可能掩盖构念覆盖范围差异并降低可解释性,引入残余测量异质性。采用环路特异性与节点拆分法评估全局与局部不一致性。所有结局指标视为连续变量,计算SMD及其95%CI以评估治疗效果,P<0.05为差异有统计学意义。计算累积排序曲线下面积(SUCRA),取值范围0%~100%,数值越高表明获益可能性越大。对包含≥10项研究的网络绘制漏斗图评估发表偏倚,对称性视为无偏倚。按随访时长与结局类型进行亚组分析。
3 结果
3.1 文献筛选与研究特征
数据库检索共获得8455条记录,经标题与摘要初筛后,94项研究进入全文审查,75项因不符合预设标准被排除,最终19项RCT纳入分析。研究筛选流程见图1。补充表S2总结了纳入研究的特征:发表于2013年至2024年间,共纳入2654例ICU患者,评估了12种不同的非药物干预,多项试验采用多组分联合策略。对照组均接受常规护理、日常护理或安慰剂。“常规护理”因国家、年代与ICU类型而异,其组成通常包括标准ICU监测、酌情物理治疗、按当地指南的营养支持、常规护理、谵妄监测实践及心理社会照护,这种差异可能是合并估计不一致的来源之一。
3.2 偏倚风险、不一致性、异质性与证据质量评估
偏倚风险评估覆盖七个领域。随机序列生成均为低风险;分配隐藏73.7%为低风险、26.3%为不明确;参与者盲法因非药物干预性质普遍不可行,84.2%为高风险;结局评估者盲法68.4%为低风险、15.8%为不明确、15.8%为高风险;所有研究均报告完整的结局数据;选择性报告94.8%为低风险、5.2%为高风险。鉴于实施偏倚高发,证据总体确定性有限,主观结局如HRQoL易受膨胀影响。其他偏倚10.5%为低风险、84.3%为不明确、5.2%为高风险。总体偏倚风险可接受。详细评估见补充图S1。全局不一致性检验显示,整体HRQoL、生理成分汇总(PCS)及心理成分汇总(MCS)均无显著不一致(P值分别为0.3434、0.8842、0.4012)。局部不一致性检验同样显示直接与间接比较无显著差异(所有P>0.05)。
3.3 主要结局
3.3.1 网络结构与几何特征
非药物干预关系的网络图见图2。整体HRQoL网络包含8项直接或间接比较与1个闭环(图2A);PCS网络包含8项直接比较与1个闭环(图2B);MCS网络包含6项直接比较与1个闭环(图2C)。
3.3.2 排序概率
补充图S2与图3展示了等级热图与SUCRA分布,描绘各非药物干预改善ICU患者HRQoL的相对有效性。SUCRA值越高,表明该干预越有可能跻身最有效之列。SUCRA值与相应效应量及95%CI一并呈现,以便平衡解读。由于所有95%CI均跨越零值,SUCRA排序应解释为相对概率,而非治疗优越性的确证证据。因此,即使SUCRA值较高(如ICU日记或ABCDE集束化策略),若对应置信区间宽且跨越无效线,仍需谨慎解读,这表明其有效性相对概率存在不确定性。图3A显示,整体HRQoL方面,ICU日记排名最高(SUCRA 84.7%),其次为认知疗法联合移动应用程序(76.5%)、电肌肉刺激联合体力活动(58.5%)、常规护理(50.1%)、多学科会诊(49.9%)、功率车(35.3%)、体力活动(29.7%)及认知疗法联合体力活动(15.3%)。这些排名仅反映相对概率,不表明干预间存在统计学显著差异。图3B显示,PCS方面,ABCDE集束化策略排名最高(SUCRA 69.1%),其次为体力活动(67.8%)、营养支持联合功率车(59.6%)、高强度体力活动(57.3%)、EMS联合功率车(51.8%)、营养支持(34.9%)、应用类认知疗法(30.4%)及常规护理(29.0%),同样需谨慎解读,因效应量无统计学意义。图3C显示,MCS方面,ABCDE集束化策略再次排名最高(76.3%),其次为体力活动(65.3%)、APP+CT(57.8%)、EMS+功率车(34.5%)、常规护理(33.4%)及高强度体力活动(32.8%)。尽管这些干预排名靠前,但均未显示统计学显著的优越性。
3.3.3 Meta分析结果
整体HRQoL、PCS及MCS的森林图见图4。整体HRQoL无显著异质性(I2=0%,P>0.05;图4A),因研究数量少(n<3),无法进行亚组分析。PCS存在显著异质性(I2=78.7%,P<0.05;图4B),按随访时长的亚组分析与Meta回归(P=0.840)均未识别出显著来源。敏感性分析显示剔除一项研究后异质性降至50%以下,提示个别试验可能对合并估计产生不成比例的影响(图4C)。MCS同样存在显著异质性(I2=78.4%,P<0.05;图4D),亚组分析与Meta回归(P=0.930)亦未识别显著来源。敏感性分析将异质性降至50%以下(图4E),再次表明异质性由特定研究驱动,而非系统性差异。序贯敏感性分析证实了效应估计的稳定性。
3.4 发表偏倚
漏斗图基本对称,Egger检验(P>0.05)提示无显著发表偏倚。
3.5 安全性评价
未报告严重不良事件。两项研究(11.11%)发生轻微不良事件,包括电极片过敏、非计划拔管、躁动及一过性低血压。所有非药物干预均被视为安全,不良事件轻微且可控。但因仅两项研究报告安全性结局,证据基础有限,关于比较安全性的结论仍不确定。极少数参与者因干预相关不良反应退出,但未影响研究结果的完整性。
4 讨论
据研究人员所知,这是首项系统评价现有非药物干预对改善ICU患者HRQoL比较有效性的网状Meta分析。共纳入19项RCT,涉及2654名参与者与12种不同干预策略。研究结果表明,若干非药物干预可能改善HRQoL,但所有置信区间均跨越零值,无干预显示统计学显著的优越性。因此,SUCRA排序应解释为相对概率指标,而非有效性的确证证据,即使高SUCRA值仍存在不确定性,不能确证有效性。当前ICU人群的HRQoL评估主要依赖通用测量工具,如36项简短健康调查(SF-36)与欧洲五维健康问卷(EQ-5D)。纳入研究的随访时长从1个月至7年不等,多数评估集中在出院后3、6及12个月。根据SUCRA排序,ICU日记、认知疗法联合移动应用程序(APP+CT)及EMS联合体力活动(EMS+PA)是改善整体HRQoL的前三位干预。ICU住院期间,患者常经历记忆空白、感知扭曲及应激相关认知改变,常伴幻觉或妄想。ICU日记基于情绪加工理论,旨在通过修正适应不良恐惧结构来重建事实记忆并减轻心理困扰。一项纳入38例ICU患者的瑞典非随机研究显示,使用日记并结合结构化随访,可在出院后6、12、24及36个月持续改善HRQoL。然而,ICU日记的实施需要护士或家属持续记录,在高工作量或资源有限的ICU环境中可能存在挑战。APP干预以患者为中心,整合认知行为疗法模块(如正念呼吸与引导情绪调节),已被证明可降低焦虑与抑郁评分。其多维设计——整合症状追踪、心理支持与社会连接——很可能促成了其较高的SUCRA排名。然而,数字治疗学的实际落地可能受患者依从性、技术可及性及临床人员培训需求的制约,这些因素在不同ICU环境中差异显著。早期活动虽是ICU康复的基石,但单独的物理康复治疗往往效果不佳,常需联合营养支持、按摩及EMS等辅助策略以对抗肌肉流失。近期随机试验与Meta分析证实,EMS可增强危重患者的肌力与功能恢复,EMS联合早期活动可显著减轻股四头肌无力并改善活动能力。Meta分析进一步显示EMS的系统获益,包括改善肌力评分及潜在缩短ICU住院时长。机制研究强调其可通过改善微循环、减少胶原沉积及增强抗氧化能力发挥作用。但其临床应用受限于对专用设备、训练有素的人员及个体化参数优化的需求。早期活动虽有益,但受血流动力学不稳定、人员短缺及方案依从性不一等现实限制。此外,治疗效果受运动参数(如强度、频率)及患者基线特征的变异影响,凸显个体化康复计划的必要性。新证据表明,每多住院一天ICU,肌力下降3%~11%,强化了长期制动与功能恶化的关联。在针对PCS改善的干预中,ABCDE集束化策略、结构化体力活动及营养支持联合功率车显示出最高的累积疗效。ABCDE集束化策略虽有效,但需要每日唤醒试验、谵妄监测与协调的活动规划,对工作量的要求高,需跨学科协作,在人员或培训资源有限的ICU中可能难以实现。体力活动干预(包括抗阻训练、目标导向活动与功能性练习)通过刺激肌肉收缩与蛋白质合成,减轻萎缩并恢复站立、行走等基本功能。个体化体力活动还可改善心肺功能、优化血流动力学与代谢、促进组织修复。但在高强度的ICU环境中,康复方案依从性不一致可能削弱这些获益,资源有限的ICU可能缺乏开展结构化活动项目所需的人力与设备。单纯营养补充在改善生理HRQoL结局方面疗效有限,尽管其在ICU患者中常被未充分利用。一种结合早期营养与物理治疗的“代谢-运动”协同模式被提出,以增强呼吸衰竭患者的氨基酸代谢并减少肌肉分解。EMS联合高蛋白营养已被证明可维持股四头肌体积。这种双向协同形成正反馈循环:营养底物为运动诱导的合成代谢提供燃料,而功率车(主动/被动模式)提高营养利用效率。纵向研究已识别重症后抑郁的时间模式,其患病率在出院后3个月与9个月达峰,此时躯体残疾加重。比较有效性分析提示,ABCDE集束化策略在MCS获益方面优于单独体力活动与数字心理健康干预。谵妄作为常见ICU并发症,延长机械通气与住院时长,并可能导致持续的认知缺陷,显著损害HRQoL。2013年疼痛、躁动与谵妄管理临床实践指南强调非药物预防策略,后续研究证实ABCDE集束化策略可有效降低谵妄风险。然而,PCS与MCS结局中观察到的显著异质性提示,ICU环境差异(如综合内科与心胸ICU)、干预强度、随访时长及HRQoL测量工具(SF-36、SF-12、EQ-5D)的差异均可能影响效应估计。尽管SMD允许跨异质工具合并,但可能掩盖构念覆盖差异并降低可解释性。此外,各国与各年代常规护理的差异也可能进一步加剧不一致性。综上所述,这些因素限制了合并结果的确定性,强调在不同ICU人群中比较非药物干预时需谨慎解读。加之纳入试验普遍高发实施偏倚,进一步降低了合并估计的可信度。由于参与者与工作人员盲法普遍不可行,HRQoL等主观结局特别易受膨胀影响,表观改善可能部分反映期望或报告效应,而非真实的干预疗效。数字治疗学在缓解心理困扰方面显示出前景,但其更广泛的影响取决于对公平性与可持续性的考量。若无审慎整合,数字工具可能无意中扩大获取与结局方面的差距。除心理症状外,执行功能障碍与记忆损害等核心MCS领域仍未得到充分靶向,凸显需专门的神经认知康复策略。体力活动可能通过内啡肽释放间接减轻焦虑,但不能替代专门设计用于恢复高阶认知功能的干预。本研究具有若干优势。首先,全面系统地检索五大数据库,并应用严格限定于RCT的纳入标准,提升了方法学稳健性。其次,使用经验证的HRQoL工具与先进的网状Meta分析技术整合直接与间接证据。第三,研究遵循PRISMA-NMA指南,纳入传递性、异质性与偏倚风险的详细评估,提高了透明度与可重复性。此外,参考文献更新纳入了2020年后发表的近期ICU康复试验,增强了证据基础的当代相关性。尽管如此,仍需承认若干局限性。符合条件的RCT数量相对较少,且非药物干预间的直接头对头比较稀疏,降低了间接估计的精确度。HRQoL结局使用不同测量工具(SF-36、SF-12、EQ-5D),可能影响标准化均数差(SMD)的计算。尽管SMD允许跨异质测量合并,但可能掩盖构念覆盖差异并降低可解释性,从而引入测量异质性。显著的临床与方法学异质性——如ICU环境、干预强度及随访时长的差异——可能影响合并估计。试验普遍高发实施偏倚进一步限制了确定性,因主观结局特别易受膨胀影响。仅纳入英文文献可能引入选择偏倚。此外,安全性证据有限,无法得出确切结论;未来试验应系统报告不良事件以夯实证据基础。综上所述,这些因素限制了合并结果的确定性,强调需谨慎解读。
5 结论
本网状Meta分析未发现具有统计学显著优越性的干预措施。SUCRA值仅指示相对可能性,而非确定的优越性。ICU日记与ABCDE集束化策略显示出最具潜力,但所有置信区间均跨越零值,结果需谨慎解读。未来亟需开展高质量、多中心RCT,采用标准化结局指标与长期随访,以验证这些发现。