老年人精神科门诊两种时钟绘制测验格式的心理测量学特性、实用性筛查截断值及可行性:与MMSE和HDS-R的关联

时间:2026年5月27日
来源:Psychiatry and Clinical Neurosciences Reports

编辑推荐:

本研究旨在比较两种时钟绘制测验(Clock Drawing Test, CDT)格式在老年人精神科门诊中的心理测量学特性、实用性筛查截断值及可行性。研究对447名≥65岁的精神科门诊患者进行回顾性分析,这些患者均完成了简易精神状态检查(Mini-Mental

广告
   X   

本研究旨在比较两种时钟绘制测验(Clock Drawing Test, CDT)格式在老年人精神科门诊中的心理测量学特性、实用性筛查截断值及可行性。研究对447名≥65岁的精神科门诊患者进行回顾性分析,这些患者均完成了简易精神状态检查(Mini-Mental State Examination, MMSE)、修订版长谷川痴呆量表(Hasegawa Dementia Scale-Revised, HDS-R)以及两种采用Freedman评分法的CDT格式:自由绘制时钟(CDT1)和检查者提供钟面(CDT2)。研究采用Pearson相关分析、强制进入式多元回归模型、探索性因子分析及受试者工作特征(receiver operating characteristic, ROC)曲线分析。可能的认知损害操作性地定义为MMSE≤23和/或HDS-R≤20。管理时间在便利亚样本(n=20)中进行汇总。结果显示,受试者平均(SD)年龄为80.20(5.15)岁,平均受教育年限为11.74(2.36)年。CDT总分与MMSE和HDS-R总分呈正相关(r=0.47–0.58,均p<0.01)。教育程度、功能残疾、CDT1和CDT2可预测MMSE总分,而年龄 additionally 预测HDS-R总分。两种CDT格式均显示出可解释的双因子结构,内部一致性良好(Cronbach's α 0.82–0.90)。ROC分析确定两种格式具有相同的实用性截断值(10/11)(CDT1曲线下面积[area under the curve, AUC] 0.72,95%置信区间[confidence interval, CI] 0.67–0.77;CDT2 AUC 0.71,95% CI 0.66–0.76)。CDT平均管理时间为2.13分钟。结论表明,两种CDT格式在老年人精神科门诊中均显示出临床可用的心理测量学特性和相似的实用性截断值。CDT1倾向于提高灵敏度,而CDT2在相同截断值下倾向于提高特异度。CDT在常规实践中高度可行,仅需约2分钟即可完成。
研究背景与问题

随着全球人口老龄化加剧,痴呆已成为重大公共卫生与社会经济挑战。2019年全球约有5740万痴呆患者,预计2050年将超过1.5亿。日本作为老龄化速度最快的社会之一,基于Hisayama研究等人群研究已记录到痴呆患病率的持续增长。与此同时,随着诊断与治疗进展,预防和终身风险降低已成为核心公共卫生优先事项。

轻度认知损害(mild cognitive impairment, MCI)指超越正常老化的认知衰退,同时基本日常生活能力相对保留,是进展为痴呆的高风险状态。在老年精神病学中,早期识别认知损害尤为重要,因为情感症状、精神病性症状、睡眠障碍及药物效应可与神经认知障碍产生重叠。及时检测有助于针对性诊断评估、危险因素干预及照护规划,包括链接社区服务。

在常规门诊实践中,简易全局认知筛查工具仍是初始评估的基石。Folstein等人编制的MMSE以及在日本广泛应用的HDS-R,可高效评估定向力、记忆力及语言能力。然而,这两种工具均受到年龄和教育程度的已知影响,且对于细微的执行功能和视空间功能障碍可能不够敏感,尤其是在高受教育程度个体或非遗忘型表现中。由于痴呆的特征是干扰日常功能的认知衰退,且常伴随痴呆的行为和心理症状(behavioral and psychological symptoms of dementia, BPSD),因此全面评估需结合简洁的功能状态与神经精神症状测量工具。在日本,为评估认知和日常功能损害而研发的社区综合照护系统痴呆评估量表(Dementia Assessment Sheet for Community-based Integrated Care System, DASC-21)及其简短版(DASC-8)已显示出良好的信度和区分效度。神经精神症状可通过神经精神量表(Neuropsychiatric Inventory, NPI)及为常规照护设计的简短问卷进行量化。

在简短神经心理学任务中,CDT因耗时短、老年受试者接受度高,且能在单次绘图中整合语义知识、视空间建构、规划及执行监控等多重认知操作而得到广泛应用。然而,系统综述强调CDT尚未标准化:施测程序(如自由绘制与检查者提供钟面、命令式与临摹式)和评分系统差异显著,这影响其心理测量学特性并限制跨研究可比性。Freedman评分法是一种结构化的CDT评分方法,提供基于成分的量化评分以支持神经心理学解释。尽管CDT研究已开展数十年,关于不同施测格式在真实老年精神病学门诊环境中的心理测量学表现仍证据有限,且鲜有研究在日本临床实践中同时考察Freedman评分法的项目水平因子结构及其与MMSE和HDS-R的关系。

本研究为一项回顾性观察研究,纳入447名≥65岁的精神科门诊患者(男性183名,女性264名),于2022年4月至2025年5月期间就诊并完成MMSE、HDS-R及两种CDT格式评估。样本来自日本独协医科大学医院精神科门诊的认知筛查常规实践,患者因认知主诉、照护者关切或疑似神经认知障碍就诊。

研究目的包括:比较两种CDT格式(CDT1为自由绘制时钟,要求画出1-12数字并将指针拨至"差一刻七点"即6:45;CDT2为检查者提供预绘钟面及数字,要求画出指针显示11:10)与全局认知筛查工具(MMSE和HDS-R)的关联;评估人口学和功能残疾对MMSE和HDS-R的预测作用;考察各CDT格式采用Freedman评分法时的因子结构和内部一致性;以及通过ROC分析探索实用性筛查截断值。需要特别说明的是,由于常规门诊筛查缺乏标准化诊断裁定,ROC分析被概念化为与常用筛查阈值的实用性操作对齐,而非旨在评估CDT替代MMSE或HDS-R的诊断准确性。

研究人员及主要技术方法

研究人员对447例门诊患者的数据进行了回顾性观察分析。样本来源为日本独协医科大学医院精神科门诊的连续就诊患者,纳入标准包括年龄≥65岁、完成MMSE、HDS-R及两种CDT格式评估,且数据完整者;缺失测试数据者被排除。因该样本为真实世界精神科门诊样本,主要精神科诊断和药物暴露呈异质性,这些因素未纳入主要分析。

在测量工具方面,研究采用MMSE(满分30分,评估定向力、登记、注意力与计算、回忆、语言及视空间建构;≤23分提示可能痴呆或临床显著认知损害)和HDS-R(满分30分,评估定向力、即刻和延迟回忆、注意力/工作记忆及言语流畅性;≤20分提示可疑痴呆)作为全局认知功能评估工具。功能状态("功能残疾")采用DASC-21评估,高分提示认知和日常功能损害较重。研究还记录了长期照护保险认证等级(日本照护需求程度的代理指标)。

本研究核心方法包括:(1)Pearson相关分析,用于考察人口学变量、功能残疾与认知测量之间的关联;(2)强制进入式多元回归模型,以MMSE和HDS-R总分为因变量,纳入性别、年龄、受教育年限、长期照护认证等级、功能残疾、CDT1总分和CDT2总分作为预测变量,评估模型诊断包括多重共线性(方差膨胀因子)和残差图检验;(3)探索性因子分析,分别对两种CDT格式的项目水平(0/1)评分进行,基于特征值、碎石图和可解释性确定保留因子数,并采用Cronbach's α评估内部一致性;(4)ROC分析,以MMSE≤23和/或HDS-R≤20作为可能的认知损害操作性定义,探索CDT的实用性筛查截断值,选择灵敏度和特异度最佳平衡的点;(5)可行性评估,在20例便利亚样本中记录CDT施测时间,并与混合式MMSE/HDS-R筛查工具(约10.2分钟)进行比较。

研究结果概述

研究结果显示,样本平均年龄80.20岁(SD 5.15),平均受教育年限11.74年(SD 2.36),长期照护认证等级均值1.04(SD 1.83),功能残疾评分均值50.06(SD 19.62)。全局认知筛查显示轻中度损害(MMSE均值21.38,SD 5.30;HDS-R均值19.13,SD 6.33)。两种CDT格式得分分布较广(CDT1均值10.03,SD 4.36;CDT2均值8.71,SD 2.96)。

相关分析表明,年龄与HDS-R(r = −0.16, p<0.01)、MMSE(r = −0.12, p<0.05)、CDT1(r = −0.19, p<0.01)和CDT2(r = −0.17, p<0.01)均呈负相关。教育程度与MMSE(r=0.30, p<0.01)、HDS-R(r=0.21, p<0.01)、CDT1(r=0.33, p<0.01)和CDT2(r=0.28, p<0.01)均呈正相关。功能残疾与HDS-R(r = −0.50, p<0.01)、MMSE(r = −0.51, p<0.01)、CDT1(r = −0.43, p<0.01)和CDT2(r = −0.34, p<0.01)呈中度负相关。MMSE与HDS-R强相关(r=0.74, p<0.01)。两种CDT格式与MMSE(CDT1 r=0.58; CDT2 r=0.53)和HDS-R(CDT1 r=0.54; CDT2 r=0.47)均呈正相关(p<0.01),且两者相互中等相关(r=0.59, p<0.01)。

多元回归分析显示,对于MMSE,教育程度(β=0.19, p<0.001)、功能残疾(β=−0.28, p<0.001)、CDT1总分(β=0.29, p<0.001)和CDT2总分(β=0.23, p<0.001)为显著预测变量,模型调整R2=0.49;对于HDS-R,年龄(β=−0.09, p<0.05)、教育程度(β=0.10, p<0.05)、功能残疾(β=−0.29, p<0.001)、CDT1总分(β=0.29, p<0.001)和CDT2总分(β=0.17, p<0.001)为显著预测变量,模型调整R2=0.43。

ROC分析表明,两种CDT格式在相同实用性截断值(10/11)下表现出可比的区分能力:CDT1的AUC为0.72(95% CI 0.67–0.77),灵敏度0.82,特异度0.55;CDT2的AUC为0.71(95% CI 0.66–0.76),灵敏度0.57,特异度0.75。即CDT1倾向于提高灵敏度,CDT2在相同截断值下倾向于提高特异度。

探索性因子分析支持两种CDT格式均存在可解释的双因子结构,内部一致性良好(Cronbach's α=0.82–0.90)。CDT1的因子1主要反映手部相关的知觉/执行组织(包括指针存在与连接、中心点放置),因子2主要反映数字相关的视空间 placement(包括数字格式、顺序和钟面内空间排列)。CDT2的因子1反映结构完整性和空间锚定(包括中心点稳定性、指针连接和无关标记缺失),因子2反映时间表征准确性(包括角度准确性和目标时间正确指示)。

可行性方面,便利亚样本(n=20)中CDT平均施测时间仅2.13分钟(SD 1.43),而混合式MMSE/HDS-R筛查工具平均需10.2分钟(SD 2.67)。

讨论与结论

研究人员在讨论中指出,本研究样本中两种CDT格式均与全局认知筛查测量(MMSE和HDS-R)存在中度关联,且采用Freedman评分法时各格式均显示出稳定的双因子结构,这与早期临床研究中CDT表现追踪痴呆严重程度并与全局认知相关的发现一致。

研究人员强调,CDT是一类任务而非单一标准化工具。既往结构化评分标准旨在捕捉钟面完整性、数字放置和指针设定中的错误,而CLOX研究通过分离命令和临摹条件强调了执行控制需求。本研究发现CDT1和CDT2共享相似的筛查截断值但因子构成不同,提示"画钟"的认知需求强烈依赖于施测方式和评分内容。CDT1的双因子解大致分离了知觉/执行组织因子与视空间放置因子;而CDT2因提供预绘钟面和数字,降低了对初始视空间建构和空间规划的需求,使相对权重偏向指针放置、时间表征和错误监控,这解释了尽管总体筛查表现相当,CDT2与MMSE和HDS-R各子领域的相关模式略有不同。

回归模型表明,教育程度和功能残疾与MMSE及HDS-R总分独立相关,这些因素也与CDT表现相关。教育相关的差异在简短全局认知筛查工具中已有充分文献记录,且既往综述强调CDT表现对人口学和情境因素敏感。这些发现反对孤立解释CDT分数;相反,应将分数与教育史和功能情境整合进行门诊决策。

神经生物学研究为CDT作为多领域任务提供了聚合效度支持。在阿尔茨海默病中,神经影像学研究将较差的CDT表现与涉及顶叶和前额叶区域的分布式网络功能障碍联系起来,这些区域参与视空间加工和执行控制。这与本研究中CDT的组织/规划和空间放置因子与认知子领域差异关联的发现一致。

研究人员特别指出,本研究的关键发现是两种CDT施测格式在与既定筛查阈值对齐时产生了相同的实用性截断值(10/11),尽管操作特征存在差异。CDT1强调灵敏度(0.82),CDT2强调特异度(0.75),提示两种格式可能根据临床优先事项(如分诊 vs. 在时间受限环境中减少假阳性)发挥互补作用。ROC分析的目的并非证明CDT可替代MMSE或HDS-R,而是评估CDT表现如何与这些广泛使用的筛查工具对齐并互补。

在可行性方面,CDT在常规门诊实践中显示出高可行性,平均仅需约2分钟。CDT2(检查者提供钟面)可能尤为实用,因为它保留了强调执行监控的指针设定成分,同时降低了绘制钟面本身的运动和视空间建构需求。当在阶梯式筛查路径中与简短全局认知测试及针对性功能/BPSD测量结合使用时,CDT可能有助于更早识别需要全面神经心理学评估和多学科照护规划的患者。

局限性方面,研究人员指出:回顾性单中心设计和精神科门诊样本限制了推广性;ROC分析使用的参考标准基于MMSE/HDS-R筛查阈值而非临床裁定诊断,引入概念循环性,应谨慎解释;Freedman评分涉及评分者判断,本数据集未正式评估评分者间信度;CDT项目评分为二分变量,基于Pearson相关性的因子分析可能产生有偏参数估计,虽观察到的双因子解可解释,但需用分类数据因子分析方法复制;斜交旋转后的模式系数可能超过1.0,不应简单解释为相关;未对心境症状、精神药物(包括抗胆碱能负荷和镇静剂)、感觉损害和运动障碍等潜在混杂因素进行建模,这些因素可能影响CDT表现;管理时间仅在便利亚样本中评估而非正式时间-动作研究,且可能受年龄、认知严重程度、精神症状、动机和临床工作流程影响,可行性估计应视为初步结果需在预期定时样本中确认;多项分析为探索性且涉及多重统计检验,需在独立数据集中复制以确认次要发现的稳健性。

研究结论为:两种采用Freedman评分法的CDT格式在老年人精神科门诊中显示出与MMSE和HDS-R有意义的心理测量学关联及可解释的双因子结构。使用实用性筛查阈值作为参考时,10/11的操作性截断值可能适用于入院筛查。鉴于CDT2在相同截断值下具有更高的特异度,检查者提供钟面格式可能特别适用于关注假阳性的常规筛查场景。但仍需进一步针对临床裁定诊断和纵向结局进行验证。

生物通微信公众号
微信
新浪微博


生物通 版权所有