针对泰国老年抑郁患者：GRID-HAM-D7最佳缓解界值研究及其临床意义

时间：2026年1月30日

来源：Frontiers in Psychiatry

编辑推荐：

本研究为老年抑郁症的精准评估提供了重要证据，通过ROC曲线分析确定了GRID-HAM-D7量表在泰国老年人群中的最佳缓解界值：任何抑郁障碍为≤4分，重性抑郁障碍（MDD）为≤6分，其敏感性（Sensitivity）和特异性（Specificity）均优于传统标准，强调了评估工具在特定人群（老年、泰国文化背景）中本地化（坎尼金）的必要性，对老年精神医学的临床决策具有重要指导意义。

引言

重性抑郁障碍（Major Depressive Disorder, MDD）是一个重大的全球性健康问题，尤其在老年人群中。抑郁症在该人群中十分常见，却经常被忽视且治疗不足。全球老年人口的患病率高达31.74%，这凸显了在老年人群中采取主动筛查和有效干预策略的重要性。面对这些挑战，临床医生需要可靠且高效的工具来进行老年精神医学的准确评估和监测。

在许多国家，由于人口结构变化导致老龄化进程加速，抑郁症患者数量正在上升。老年抑郁的临床表现往往更为复杂，可能包括在重性抑郁发作之前或同时存在的慢性轻度症状，这种情况被称为双重抑郁（Double Depression），即持续性抑郁障碍（Persistent Depressive Disorder, PDD，旧称心境恶劣）与重性抑郁障碍共存。双重抑郁与更严重的症状、更长的病程和更差的治疗结局相关。除了直接的情绪困扰，老年抑郁还与残疾率显著增加、躯体疾病预后更差以及生活质量大幅下降有关。此外，未经治疗或管理不善的老年抑郁与医疗资源使用增加和死亡率（包括自杀）升高相关。

临床医生在诊断和管理晚发性抑郁时面临巨大挑战。老年患者的抑郁症状表现可能不典型，核心症状如持续悲伤或绝望感有时会被躯体主诉、认知障碍、快感缺失、睡眠障碍和显著的疲劳感所掩盖。一些老年患者可能难以表达情绪相关的痛苦，或将症状归因于衰老或躯体疾病。因此，尽管DSM-5和ICD-10等标准诊断系统被广泛使用且通常有效，但可能无法完全捕捉老年人群独特的症状表现。

在治疗老年抑郁时，持续的症状监测对于评估治疗反应、调整治疗干预以及支持医患共同决策至关重要。标准化评定量表的使用如今在临床试验和真实世界实践中已是常规，使得系统追踪症状严重程度和缓解状态成为可能。其中， clinician-rated scales（ clinician-rated scales）在确保客观评估方面尤其有价值，特别是在存在认知障碍或自知力不全的人群中。

汉密尔顿抑郁评定量表（Hamilton Depression Rating Scale, HAMD）自1960年开发以来，是全球使用最广泛的 clinician-administered depression rating scales之一。其17项版本（HAM-D₁₇）旨在评估一系列抑郁症状，已成为评估抑郁严重程度和治疗效果的金标准。考虑到患者群体的多样性和护理环境的差异，更简短的HAMD版本被引入，以应对患者疲劳、认知局限和临床时间限制等实际挑战。本研究 specifically utilizes the 7-item HAM-D₇validated by McIntyre and colleagues。该版本针对一组核心抑郁症状，特别适合可能从更简短评估中受益的老年人，且不牺牲诊断准确性。

HAM-D₇包括以下项目：（1）抑郁心境，（2）罪恶感，（3）自杀，（4）工作和活动困难，（5）精神性焦虑，（6）躯体性焦虑，以及（7）一般躯体症状。通过明确采用此配置，本研究旨在确定泰国老年人群的最佳缓解界值分，并为老年精神医学中更定制化、基于证据的评估标准做出贡献。

然而，更长的HAMD版本存在实际局限性。老年患者可能经历疲劳或认知局限，而临床医生面临时间限制，尤其是在繁忙的门诊或研究对象数量庞大的研究环境中。这些现实情况促使了更简短、更聚焦的HAMD版本的开发。HAM-D₇仅包含七个核心项目，旨在快速而有效地评估主要抑郁症状，重点关注心境、罪恶感、工作和活动、精神运动性迟滞、焦虑和躯体症状等领域。这个简版由经过培训的评估者施测仅需2-3分钟，使其在临床和研究环境中都非常实用。

尽管简短，HAM-D₇在初始评估和监测缓解方面已显示出足够的效度和信度。缓解（Remission）——定义为抑郁症状接近或完全消失——是抑郁治疗的目标，并与更好的功能和长期结局相关。传统上，分数≤3被用来定义完全缓解，反映抑郁症状的缺失或最小存在。然而，新的证据——包括来自泰国老年人群的研究结果——表明，界值分≤4可能更适合该人群，以解释此年龄段常见的与年龄相关的躯体或阈下症状。分数落在缓解界值和指示活动性抑郁的范围（通常为5–7分）之间被解释为部分缓解，表示存在不符合重性抑郁发作完整诊断标准但仍可能影响功能的残留症状。超过此范围的分数则提示未缓解，存在持续性的临床显著抑郁症状。因此，确定和利用适当的HAM-D₇界值分对于准确监测治疗反应和指导临床决策至关重要，尤其是在老年抑郁患者中。

近期，抑郁评估领域的进一步发展产生了GRID-HAMD，这是原始HAMD的技术增强和标准化版本。引入GRID系统是为了通过明确定义每个项目的评估过程来提高抑郁评分的一致性、信度和透明度。与传统的单维评分不同，GRID-HAMD采用双轴框架，对每个症状的频率和强度分别进行评分。每个组成部分单独评分，然后合并得出该项目的最终分数。GRID方法为评分者提供了更详细的指导，从而减少了模糊性和评分者间变异——这是在多中心研究和临床实践中的一项重要进步。GRID-HAM-D₇是遵循这种结构化GRID方法的7项版本，最高分可达26分。

HAM-D₇和GRID-HAM-D₇在老年患者中的使用有所增加，特别是当认识到该人群可从简短而可靠的抑郁评估中受益时。尽管简版抑郁评定量表在老年人群中的受欢迎度日益增长，但大多数已发表的研究评估的是17项（GRID-HAMD-17）和21项（GRID-HAMD-21）版本，而非本研究 specifically considered的7项形式（HAM-D₇或GRID-HAM-D₇）。然而，大多数已发表的缓解界值分来源于年轻成人或混合年龄样本的队列，可能无法直接应用于老年人。衰老与神经生物学变化、医疗共病和多药治疗相关，所有这些都可能影响抑郁症状的表达和评估。此外，文化背景可能进一步影响症状的报告、检测和理解，特别是在非西方人群，如泰国。可靠地识别缓解对于定制治疗计划、最小化不必要的药物暴露和提高患者结局至关重要。

尽管准确评估泰国老年抑郁患者的缓解状态至关重要，但目前尚无针对该人群的GRID-HAM-D₇既定最佳界值分。虽然本研究使用了2012年10月至2015年3月期间收集的数据，但抑郁症状严重程度与诊断缓解之间的关系，以及评分工具本身，在随后的几年中并未发生根本性变化。此外，针对泰国老年人的、经过本地验证的大规模研究仍然稀缺，而本研究的结果对当前的临床评估具有直接相关性。通过评估和定义GRID-HAM-D₇在这一研究不足人群中的最佳界值点，本研究填补了老年抑郁护理中一个持续存在的空白。建立人群特异性的缓解标准可以提高临床护理的精确性，促进研究和实践中更有效的监测，并最终改善患有抑郁症的老年人的生活。

材料与方法

本研究是DAS项目的一部分，该项目是一项为期一年的综合性观察性随访队列研究，旨在调查泰国老年人的心理健康状况。研究共招募了803名最初在全国四个主要三级医疗中心的精神科或老年科门诊就诊的老年人。数据收集时间为2012年10月至2015年3月。本分析仅使用了基线数据。DAS项目的总体目标是评估在首次就诊时主诉一系列症状的老年人是否存在任何精神科诊断。

所有研究程序均经过泰国中央研究伦理委员会、Prasat神经病学研究所伦理委员会和Songkhla Rajanagarindra精神病医院伦理委员会的审查和批准。研究参与完全自愿，所有参与者均接受了研究目标和程序的详细说明。在参与前，获得了所有受试者的书面知情同意。

参与者

连续招募了803名泰国老年患者，他们来自泰国不同地区的四个三级医疗中心。入组资格标准包括：（1）年龄60岁或以上；（2）未曾在参与研究的门诊机构接受过服务的新患者；（3）至少存在一种自我报告的症状，如无聊感、悲伤、睡眠障碍、食欲不振、疲劳、记忆力差或无法解释的躯体主诉。排除标准包括：（1）存在干扰临床访谈的严重躯体症状；（2）诊断为物质使用障碍；（3）存在与研究团队沟通的显著语言障碍；（4）诊断为痴呆或其他主要认知障碍；（5）有精神分裂症、分裂情感障碍或躁狂发作史。这种严谨的纳入和排除过程确保了研究人群能够代表寻求门诊心理健康服务的老年人，同时最大限度地减少了可能干扰抑郁和精神症状准确评估的混杂因素。

测量工具

泰国版HAM-D₇和GRID-HAM-D₇

本研究中使用的泰国版HAM-D₇严格遵循McIntyre及其同事验证的7项配置。该量表评估以下七个抑郁症状领域：（1）抑郁心境，（2）罪恶感，（3）自杀，（4）工作和活动困难，（5）精神性焦虑，（6）躯体性焦虑，以及（7）一般躯体症状。这种明确列出确保了所评估的HAM-D₇具体版本的清晰性，并支持结果的准确解释和可重复性。泰国版HAM-D₇是根据心理工具翻译和文化适应指南严格开发的。在翻译前获得了原作者的许可。首先，第一作者将英文版HAM-D₇翻译成泰文。接着，一位双语专家（母语为英语和泰语，具有专业书籍写作经验）进行了回译（从泰文到英文）。然后比较原版和回译版，以确保语义对等。翻译团队讨论并解决了差异，最终确定了泰文版HAM-D₇。

泰文版HAM-D₇的内部一致性可以接受，Cronbach's α系数为0.72。当使用界值分4来定义缓解时，该量表显示出高特异性（97%）。该工具还表现出出色的区分能力，曲线下面积（Area Under the Curve, AUC）为0.97（95% CI 0.94–1.01），标准误为0.019。

作为研究的一部分，随后采用了GRID-HAMD系统。开发GRID-HAMD是为了通过引入更结构化的项目评分格式来进一步增强量表的可用性，从而提高清晰度、评分者一致性和整体准确性。GRID方法促进了对症状频率和强度的标准化评分，使其适用于多中心研究，并确保在泰国老年参与者中进行可靠的症状评估。

迷你国际神经精神访谈5.0版

所有参与者均根据DSM-IV标准，使用迷你国际神经精神访谈（Mini-International Neuropsychiatric Interview, MINI）5.0版进行抑郁障碍诊断。MINI是一种用于根据DSM-IV诊断精神障碍的结构化访谈。泰文版MINI 5.0版已被精神科医生和受过培训的临床医生广泛使用。其MDD的Kappa系数为0.87。

HAM-D₇培训

使用HAM-D₇正确评估抑郁需要标准化的评分者培训。为确保泰文版HAM-D₇的评分者间信度，为所有参与的医生和临床医生进行了研究前培训。尽管临床医生在日常临床实践中已熟悉HAM-D₁₇，但培训特别侧重于泰文版GRID-HAM-D₇的施测、评分程序和解释。

培训期间，特别强调了GRID-HAM-D₇的独特方面，包括对每个项目进行频率和强度评分的结构化方法。评分者被逐步指导使用标准化问题，并 instructed 根据参与者报告的频率和症状细节记录反应。主要目标是实现评分的一致性，而非评估每位医生的临床专业知识。

在研究开始前，严格评估了评分者间信度，并达到了100%的评分一致性。这一过程确保了整个研究过程中的所有评估均按照GRID-HAM-D₇的结构化方法一致地进行。

统计分析

使用描述性统计（包括频数和百分比）来总结样本的人口学和临床特征。通过计算敏感性和特异性，评估了泰文版GRID-HAM-D₇的诊断性能，其中以基于DSM-IV标准的MINI作为抑郁诊断的金标准。此外，还计算了阳性预测值（Positive Predictive Value, PPV）和阴性预测值（Negative Predictive Value, NPV），以评估给定的GRID-HAM-D₇分数准确识别缓解和非缓解的可能性。

为确定GRID-HAM-D₇上缓解的最佳界值分，计算了约登指数（Youden Index, J），该指数最大化敏感性和特异性之和，指示具有最佳整体诊断准确性的界值。此外，进行了受试者操作特征曲线（Receiver Operating Characteristic Curve, ROC curve）分析，并计算了曲线下面积（AUC），以评估GRID-HAM-D₇在区分缓解与非缓解病例方面的判别能力。

所有统计分析均使用社会科学统计软件包（Statistical Package for the Social Sciences, SPSS）22.0版 for Windows 和 MedCalc 12.3版进行。

结果

研究参与者的人口学和临床特征如表1所示。大多数参与者为女性且已婚。超过一半的人处于失业状态并报告低收入水平。在803名参与者中，23.67%被诊断为抑郁障碍，其中72.6%患有重性抑郁障碍（MDD），占总样本的17.19%（如表2所示）。当将心境恶劣障碍排除在分析之外时，MDD（包括双重抑郁病例）的患病率为138/760，即18.16%。

比较临床亚组时，混合性焦虑和抑郁障碍组的平均HAMD-7分数最高，表明该亚组内的症状严重程度高于其他抑郁诊断组（表3）。

对于任何抑郁障碍，GRID-HAM-D₇的ROC曲线下面积（AUC）为0.88，标准误0.017，95%置信区间0.86至0.90，z统计量22.56，p <0.0001（图1）。表4展示了不同GRID-HAM-D₇界值分在识别老年患者缓解方面的诊断性能。最优界值点为≤4分，其产生了最高的约登指数（J = 0.64），表明对该人群敏感性和特异性达到了最佳平衡。在此标准下，敏感性为88.86%，表明该工具准确检测已达到缓解的患者能力很强。特异性为77.66%，同样显示出识别未缓解患者的高准确率。此外，阳性预测值（PPV）为92.6%，表明绝大多数被分类为缓解的个体确实处于缓解状态。阴性预测值（NPV）为64.6%，提示超过一半的非缓解分类是正确的，尽管存在一定的假阴性可能性。阳性似然比（+LR）为3.89，表明阳性检测结果显著增加了缓解的可能性；而阴性似然比（-LR）为0.17，表明阴性结果显著降低了缓解的概率。这些发现共同证实，对于泰国老年人群的任何抑郁障碍，GRID-HAM-D₇界值分≤4在评估缓解方面既敏感又特异。

对于重性抑郁障碍（MDD），GRID-HAM-D₇的ROC曲线下面积（AUC）为0.92，标准误0.02，95%置信区间0.90至0.94，z统计量27.69，p <0.0001（图2）。表5展示了不同GRID-HAM-D₇界值分在识别老年MDD患者缓解方面的诊断性能。最优界值点为≤6分，其产生了最高的约登指数（J = 0.71），表明对该人群敏感性和特异性达到了最佳平衡。在此标准下，敏感性为91.68%，表明该工具准确检测已达到缓解的患者能力非常强。特异性为79.73%，同样显示出识别未缓解患者的高准确率。此外，阳性预测值（PPV）为95.2%，表明绝大多数被分类为缓解的个体确实处于缓解状态。阴性预测值（NPV）为68.6%，提示超过一半的非缓解分类是正确的，尽管存在一定的假阴性可能性。阳性似然比（+LR）为4.52，表明阳性检测结果显著增加了缓解的可能性；而阴性似然比（-LR）为0.10，表明阴性结果显著降低了缓解的概率。这些发现共同证实，对于泰国老年人群的重性抑郁障碍，GRID-HAM-D₇界值分≤6在评估缓解方面既敏感又特异。

讨论

本研究通过为GRID-HAM-D₇在泰国老年抑郁患者中的使用建立独特的、诊断特异性的缓解界值分（任何抑郁障碍为≤4分，MDD为≤6分），提供了重要的循证建议。这些发现强调了在晚年生活中以及跨诊断类别中，抑郁症状表现的异质性，因此需要量身定制的评估策略。

任何抑郁障碍与MDD最佳界值分的区分强化了日益增长的认识，即晚发性抑郁在表现和严重程度上具有高度异质性。与年轻队列相比，老年患者往往报告更多的躯体症状、更严重的认知主诉和不太突出的情感症状。近期的研究表明，在年轻、主要为西方样本中建立的标准HAM-D或GRID-HAM-D₇界值可能不足以捕捉老年或东亚人群的缓解情况。我们的发现与这一观点一致，表明传统界值（≤3分）可能过于严格， potentially failing to identify significant numbers of elderly patients who have, in fact, achieved a clinically meaningful remission.

本研究中观察到的诊断准确性参数支持GRID-HAM-D₇的临床实用性。MDD的较高界值（≤6分）产生了0.71的约登指数，其敏感性（91.68%）和特异性（79.73%）优于任何抑郁障碍的≤4分界值（约登指数0.64；敏感性88.86%，特异性77.66%）。这与Zimmerman及其同事的研究相呼应，他们警告说，对于具有更慢性或躯体症状特征的人群（如老年人），过于严格的缓解界值可能不合适。我们样本中改善的阳性预测值（PPV）表明，当GRID-HAM-D₇分数指示缓解时，临床医生可以充满信心，尤其是在MDD背景下，几乎所有被分类为缓解的个体确实符合临床缓解标准。

我们的结果还强调了文化和情境适宜性基准的重要性。文化因素——包括对心理健康的不同态度、心理痛苦的躯体化表达以及病耻感——直接影响抑郁症状的报告和临床识别。在泰国背景下，心理健康污名可能导致情绪症状的报告不足，以及倾向于通过躯体主诉来表达痛苦。这凸显了GRID-HAM-D₇的价值，它提供了一种维度方法，能更好地捕捉非西方背景下晚发性抑郁特有的表现广度。

此外，我们的结果基于先前对GRID-HAM-D₁₇的心理测量学评估。Williams及其同事已经证明了GRID格式在增强评分者间信度和症状评估粒度方面的优势。在老年样本中，这些优势可能尤其相关，因为认知障碍或医疗共病进一步使临床评分和主观自我报告复杂化。通过阐明哪些界值分能最大化老年人的诊断准确性，我们的发现增强了GRID-HAM-D₇作为研究和临床工具的实用性。

然而，两个类别中中等的阴性预测值（NPV）表明，在解释阴性检测结果时应谨慎行事；相当一部分非缓解分类可能仍然代表已缓解的病例，这呼应了先前研究强调的老年抑郁评估的复杂性。这一发现提示，特别是在"临界"病例中，全面的临床评估——包括来自照顾者的辅助信息和对更广泛心理社会背景的考量——仍然是必不可少的。

最后，我们的结果支持未来的研究应超越静态界值验证，转向纵向研究，检查通过这些界值评估的缓解如何与功能结局、复发率和患者长期生活质量相关联。这些数据对于将诊断准确性转化为患者护理的有意义改善至关重要。

需要指出的是，我们的数据收集于2012年至2015年之间。然而，晚发性抑郁的临床和心理测量学背景——以及GRID-HAM-D₇的诊断相关性——自那时起基本保持不变。针对泰国老年人群的大样本、人群特异性研究仍然稀缺，因此我们的发现对当代临床护理和研究仍然高度相关。我们的工作有助于弥合这一不断增长的人口统计学群体在循证实践中持续存在的空白。

局限性

有几个局限性值得考虑。首先，尽管数据收集发生在2012年至2015年之间，但目前仍缺乏近期大规模研究关注GRID-HAM-D₇在亚洲或泰国老年人群中的缓解界值。近期文献继续强调老年抑郁评估工具缺乏人群特异性验证研究，这凸显了我们研究发现的持续相关性和贡献，尽管数据集年代较早。其次，样本来源于选定的临床环境，这可能限制结果在泰国乃至更广泛社区老年人群中的普适性。未来的研究应扩大范围，涵盖更多样化的患者人口统计学特征和多种护理环境。第三，评估完全依赖于 clinician-rated的GRID-HAM-D₇。虽然该工具经过验证且稳健，但辅以患者自评量表可以提供额外视角，特别是关于临床医生可能遗漏的主观幸福感和症状学。第四，尽管本研究确定了与强诊断准确性相对应的最佳界值，但我们未将这些界值与纵向结局或治疗轨迹直接联系起来。建议进行前瞻性研究，以检验通过这些界值分类的缓解是否转化为日常功能、复发率或整体幸福感的 meaningful improvements。第五，文化因素，包括污名化和心理痛苦的躯体化，可能影响了症状报告。定性研究可以阐明文化背景如何影响缓解的诊断和自我感知，指导泰国及类似环境中评估工具和临床访谈的完善。最后，虽然排除了患有严重躯体疾病或认知障碍的参与者以尽量减少主要混杂因素，但抑郁症状（如疲劳、躯体主诉和认知迟缓）与正常衰老或老年个体共病医疗状况之间仍然存在大量重叠。不能完全消除将症状错误归因于抑郁或年龄相关变化的可能性，在解释研究结果时应考虑到这一点。

结论

本研究通过为GRID-HAM-D₇建立独特的、诊断特异性的缓解界值分（任何抑郁障碍为≤4分，MDD为≤6分），为GRID-HAM-D₇在泰国老年患者中的使用提供了关键证据。这些发现证实了需要量身定制的评估策略，以解释晚年生活中和跨诊断类别抑郁症状表现的异质性。

通过提供基于经验得出的、人群特异性的界值分，本研究支持更准确地识别缓解，为临床决策提供信息，并 potentially facilitating improved patient outcomes。未来的研究应在更广泛的环境中验证这些界值分，并将其与长期康复和生活质量联系起来，以确保老年人在衰老过程中获得优化的、文化敏感的抑郁护理。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部