综述:痴呆症疼痛:观察性评估工具测量属性的系统评价

时间:2026年1月21日
来源:Clinical Psychology Review

编辑推荐:

这篇系统评价严格遵循COSMIN框架,对痴呆症老年人观察性疼痛评估工具的心理测量学证据进行了全面评估。通过对121项研究的分析,确定了30种工具,其中5种(如PAINAD、PACSLAC等)获得强烈推荐。研究发现,结构效度和内容效度等关键测量属性研究不足,而结构效度和反应度证据较强。文章为临床工具选择提供了实证依据,并指出了未来研究应优先关注工具内部结构验证和跨文化适用性。

广告
   X   

背景
痴呆症老年人中疼痛普遍存在,约60-80%的个体经历日常疼痛,超过三分之一的长期照护机构居民患有中度至重度疼痛。由于沟通障碍,该群体的疼痛评估极具挑战性。观察性疼痛评估工具(即观察者报告的检查表)应运而生,通过系统记录非言语疼痛行为来辅助准确识别。这些工具通常包含反映六个行为领域的项目,包括面部表情、身体运动、发声等。
尽管相关工具和研究数量激增,但多数工具要么评估不足,要么显示出不足的心理测量学特性。以往综述虽有所总结,但存在选择性评估、使用不同方法论框架等问题。本综述采用COSMIN(健康状态测量工具选择共识标准)这一稳健框架,对截至2025年9月的文献进行了系统性检索和严格评估,旨在提供最新的、方法学严谨的证据总结。
方法
本综述已在PROSPERO预注册。系统检索了Medline、PsycINFO、CINAHL和Web of Science等数据库。纳入标准包括:以心理测量学检验为主要目的的原创性研究、样本为65岁及以上痴呆症老年人、评估观察性疼痛工具、经同行评审的英文文献。研究筛选和数据提取遵循PRISMA-COSMIN指南。
采用COSMIN框架对九项测量属性进行评估:结构效度、内部一致性、跨文化效度、信度、测量等值性、测量误差、效标效度、结构效度和反应度。对每项研究的方**法学质量(偏倚风险)、测量属性结果和证据质量(采用改良GRADE方法)进行了三步评估。并基于心理测量学证据强度,对每种工具给出了“强烈推荐”、“暂定推荐”或“暂无推荐”的建议。
结果
共筛选22,154条记录,最终纳入121项研究。涉及30种观察性疼痛评估工具,参与者平均年龄84.7岁,女性占71%,研究多设在长期照护机构(48%)和医院(31%)等场景。
  • 工具推荐:五种工具获得强烈推荐:MOBID-2、PACSLAC、PACSLAC-II、PAINAD和PAIC-15。它们在有多个独立研究验证、关键测量属性(效度、信度、反应度)至少为低质量且充足、充足评级多于不足/不确定评级等方面表现优异。另有八种工具(如Abbey疼痛量表APS、Doloplus-2等)因至少有一项充足的低质量测量属性而获得暂定推荐。其余工具因证据有限,暂无推荐。
  • 测量属性分析
    • 内容效度:21种工具被评估,多数开发研究的方法学质量有限,项目相关性的证据通常充足,但全面性证据不一致。证据质量从极低到高不等。
    • 结构效度:仅10种工具有相关数据,是研究最不足的属性之一。多数研究存在严重或非常严重的偏倚风险(如小样本、使用PCA/EFA而非CFA)。仅PACSLAC-II(波斯语版)在一个研究中显示出充足的证据。证据质量普遍为极低。
    • 内部一致性:25种工具有证据,是研究较充分的属性。多数研究偏倚风险为无或轻微。8种工具证据充足,12种工具因缺乏结构效度证据等被评为不确定。证据质量多为低或中等。
    • 信度(评定者间/重测):27种工具有证据,但方法学问题导致偏倚风险从无到非常严重不等。8种工具证据充足,11种工具证据不足,结果常不一致。证据质量从极低到中等。
    • 测量误差:仅有3项研究涉及3种工具,是研究最少的属性之一。证据有限。
    • 结构效度(假设检验):是研究最充分的属性(79项记录,29种工具)。多数工具显示出与预期方向一致的充足效度证据(如与其他疼痛工具强相关)。偏倚风险通常较低。证据质量从极低到高不等。
    • 反应度:23种工具有证据(34项记录),表明工具能区分疼痛/非疼痛状态或检测干预前后变化。多数研究偏倚风险低,18种工具证据充足。证据质量从极低到高不等。
    • 跨文化效度/测量等值性/效标效度:未发现符合COSMIN标准的研究证据。
讨论与展望
本综述确认了MOBID-2、PACSLAC、PACSLAC-II、PAINAD和PAIC-15这五种工具拥有当前最有力的心理测量学证据支持,与部分先前临床指南和综述结论一致。这些工具在项目结构、评分方式和覆盖的疼痛行为领域上各有特点,临床选择时需结合具体情境和实用性。
研究发现,观察性疼痛评估研究存在显著的方法学局限性,包括统计方法和报告不一致、样本量小、许多工具开发缺乏清晰的概念框架、内容效度检验不充分(尤其在工具翻译过程中)等。
未来研究应优先深化对推荐工具的验证,而非开发概念重叠的新工具。重点应放在:
  1. 1.
    使用验证性因子分析(CFA)等假设驱动方法深入探究工具的内部结构(结构效度)
  2. 2.
    加强跨文化效度研究,确保翻译工具在不同文化和语言背景下的有效性。
  3. 3.
    遵循COSMIN标准提高信度研究的质量和一致性。
  4. 4.
    拓展研究场景(如急性护理、 palliative care)和研究设计(如纵向研究)。
  5. 5.
    关注人工智能(AI)驱动的疼痛评估技术和数字化工具的发展前景。
结论
通过严格遵循PRISMA-COSMIN指南,本综述为痴呆症观察性疼痛评估工具的心理测量学证据提供了高标准、全面的评价。结果明确了少数具有坚实证据支持的推荐工具,澄清了一些工具此前存在的混合发现,并指出了有潜力但需进一步验证的新工具。 beyond psychometrics,综述揭示了该领域在工具开发和研究方法上存在的系统性局限,为未来研究指明了需要改进的方向,包括提升方法学严谨性、澄清概念基础以及关注临床可行性和跨文化适用性。

生物通微信公众号
微信
新浪微博


生物通 版权所有