在急性后期护理和长期护理环境中,老年人中孤独感、抑郁和焦虑情绪普遍存在,并且这些情绪与不良健康结果相关。现有的心理社会干预措施往往面临可扩展性和持续参与度方面的挑战。
这项初步的可行性研究评估了一种基于人工智能、通过语音驱动的电话干预方法,旨在促进与老年人的对话互动。共有33名居民被联系到,其中28人参与了研究,他们主要来自专业护理机构(skilled nursing facilities)和辅助生活设施(assisted living facilities),还有一些人来自独立生活环境;在4周的评估期间,有23人完成了基线和后续评估。
参与者表现出抑郁和焦虑症状的减轻,尤其是在基线症状较重的参与者中变化更为显著。患者健康问卷-9(Patient Health Questionnaire–9)得分≥10的参与者平均减少了5.7分,总体而言,广泛性焦虑障碍7项量表(Generalized Anxiety Disorder 7-item scale)的得分中位数下降了2.3分。
鉴于这项研究的探索性质和方法学局限性,这些初步发现应谨慎解读。需要进一步的研究来评估该干预措施在更大规模、随机对照试验中的有效性和普遍性。
问题与意义
在急性后期护理和长期护理(PALTC)环境中,包括专业护理机构(SNFs)和辅助生活环境中的老年人,面临更高的孤独感、抑郁和焦虑风险。
1 从独立生活状态过渡到这些环境通常会增加孤立感和痛苦。
2 在专业护理机构中,61%的居民报告有中度孤独感,35%的居民报告有严重孤独感。
3 社交孤立与心血管疾病、中风、认知衰退和死亡风险增加有关。
4 2023年,美国卫生局局长将孤独感称为“严重的公共卫生问题”。
5 基于小组的非药物干预措施显示出一定效果,但常常存在实施不一致、人员需求高和可持续性有限的问题。
6 ,
7 ,
8 许多干预措施是针对特定子群体设计的,因此难以大规模推广或复制。
7 ,8 这些局限性凸显了在PALTC环境中需要新型、可扩展的情感支持方法。
创新
我们开发了Meela,这是一种基于人工智能(AI)的语音系统,旨在通过标准电话通话为老年人提供结构化的对话互动。参与者可以在预定时间接收自动拨入的电话,或者拨打一个专用号码发起通话。无需互联网、屏幕或新设备;用户只需像正常交谈一样拿起电话即可。
在每次通话中,Meela使用语音识别技术转录参与者的回答,通过对话语言模型进行处理,并通过合成声音给出回应。对话遵循一定的结构——问候语、问候问题以及开放式提示。该系统会保留之前对话中的某些细节,如个人兴趣或经常提到的家庭成员,并在未来的通话中引用这些信息。(参见
补充图1 中的示例对话。)
该系统是为老年人设计的,不需要数字素养或特殊设备。它利用现有的基础设施,结合自我导向的通话模式和最小的工作人员参与度,使其能够在专业护理、辅助生活和独立生活环境中实施。
实施
我们通过收集基本信息(姓名、电话号码和个人兴趣)来招募和登记参与者,以便个性化互动。使用标准化同意书获得了参与者的知情同意(见
补充图2 )。
纳入标准包括:能够听见声音、清晰表达、能够操作电话、能够进行对话、理解自己正在与AI系统互动,并能提供知情同意的居民。工作人员对参与者进行了预筛选,以确保他们具有足够的认知能力来做出同意和参与决策;没有进行正式的认知测试(例如简易精神状态检查(Mini-Mental State Examination)和蒙特利尔认知评估(Montreal Cognitive Assessment)。排除标准包括严重的听力或言语障碍,或妨碍有效参与的认知障碍。
参与者可以选择每周希望接收的预定通话次数(最多7次),并且可以拨打专用号码发起通话。工作人员的参与度很低,仅限于基本指导。干预期为4周,在此期间参与者可以继续进行日常活动(社交、娱乐和治疗项目),这些活动没有受到限制或改变。
系统会在预定时间自动拨打电话,参与者像接普通电话一样接听。在通话过程中,他们会自然地回答问题或提示。系统实时转录他们的话语,使用对话语言模型生成回复,并通过合成声音传达。对话包含一系列开放式问题和问候语,并根据参与者的偏好进行发展。系统会保留之前通话中的某些细节(如姓名、兴趣或反复出现的主题),以便在未来互动中个性化。(参见
补充图1 作为示例。)
我们将所有数据存储在一个符合《健康保险便携性和责任法案》(Health Insurance Portability and Accountability Act)以及系统和组织控制要求(Systems and Organization Controls 2)的平台中,该平台具有加密和基于角色的访问控制功能。结果使用患者健康问卷-9(PHQ-9)和广泛性焦虑障碍7项量表(GAD-7)在基线和随访时进行评估。
评估
工作人员确定33名居民符合条件;28人同意参与,5人拒绝(参与率为84.8%)。其中23人完成了基线和后续评估,并被纳入最终分析。排除的情况包括:3人在随访期间失去联系,1人认知能力显著下降,2人拒绝让数据被纳入分析。样本偏向于接受较高水平护理的居民:16人(69.6%)住在专业护理机构,6人(26.1%)住在辅助生活机构,1人(4.3%)住在独立生活机构。参与者的年龄范围从48岁到92岁(平均年龄=76.4岁,标准差=10.16岁),其中包括16名女性和7名男性。
基线时的PHQ-9抑郁得分范围为0到17分(平均分=7.78分,标准差=5.14分),表明存在轻度抑郁症状。干预后,抑郁得分平均减少了2.00分[标准差=4.17分;t(22) = 2.30,P = 0.031]。在基线时抑郁症状中度至重度的参与者(PHQ-9 ≥10;n = 9)中,抑郁得分平均减少了5.67分[标准差=4.09分;t(8) = 4.15,P = 0.003]。
基线时的GAD-7焦虑得分范围为0到17分(平均分=6.26分,标准差=5.44分)。由于分布不均匀,我们使用Wilcoxon符号秩检验来比较干预前后的得分,结果显示焦虑得分的中位数显著减少了2.30分(标准差=4.26分;z = −2.60,P = 0.017)。在基线时焦虑症状中度至重度的参与者(GAD-7 ≥10;n = 5)中,焦虑得分平均减少了6.40分[标准差=3.65分;t(4) = 3.92,P = 0.017]。
图1 使用箱线图展示了抑郁和焦虑得分的减少情况。
下载:高分辨率图片(262KB) 下载:全尺寸图片 图1 。干预前后的(A)PHQ-9和(B)GAD-7得分。箱线图显示了4周干预前后抑郁(PHQ-9)和焦虑(GAD-7)得分的变化。两项指标都从基线到随访有所下降。此表格的PDF版本可在www.sciencedirect.com
下载。
对PHQ-9抑郁得分和GAD-7焦虑得分进行了事后功效分析(n = 23)。PHQ-9的事后功效为72%,GAD-7的事后功效为83%。所有统计分析都在95%的置信区间内进行。使用SAS 9.4作为统计分析工具。
评论
这项初步研究评估了Meela的可行性,这是一种基于AI的语音系统,旨在为PALTC环境中的老年人提供对话互动。参与者在4周的评估期间通过预定和按需的通话进行了互动。初步分析显示,抑郁和焦虑症状有所减轻,尤其是在基线症状较重的参与者中。
鉴于存在一些限制,应谨慎解读这些结果:样本量较小、没有对照组、随访期较短,以及地理和人口统计学多样性有限。参与者继续进行日常活动(社交、娱乐和治疗课程),这些活动可能影响了他们的情绪状态。这些潜在的混杂因素在初步设计中未得到控制。
虽然没有进行正式的认知测试(简易精神状态检查和蒙特利尔认知评估),但工作人员对参与者进行了预筛选,以确保他们具有同意和对话的能力。该研究在机构首席医疗主任的监督下进行,符合IRB豁免的机构标准,属于低风险可行性评估。
尽管存在这些限制,研究结果仍令人鼓舞,表明基于AI的语音陪伴可能为PALTC环境中的情感支持提供一种低门槛、可扩展的工具。未来的工作应包括更大规模的随机对照试验,并延长随访时间,以验证结果并探索特定人群的益处。
数据声明
鉴于本研究问题的敏感性,我们向调查受访者保证他们的原始数据将严格保密。
生成式AI使用声明
作者承认在手稿编写过程中使用了AI辅助技术,包括ChatGPT(OpenAI)来提高写作清晰度和语法准确性,Perplexity AI用于参考文献识别,Scite AI用于参考文献验证和语气调整。所有由AI生成的内容都经过了仔细审查和编辑,以确保准确性和完整性。