利用人工智能驱动的语音助手来改善老年人在急性期后和长期护理环境中的心理健康：一项可行性研究

生物通首页 > 今日动态 > 正文

利用人工智能驱动的语音助手来改善老年人在急性期后和长期护理环境中的心理健康：一项可行性研究

时间：2026年1月23日

来源：Journal of the American Medical Directors Association

编辑推荐：

AI语音干预可改善长期护理老人抑郁焦虑症状初步研究显示PHQ-9和GAD-7评分下降，但样本小且无对照组需谨慎解读。

扎卡里·J·帕莱斯（Zachary J. Palace）|约书亚·萨切梅奇安（Joshua Sachemechian）|纳撒尼尔·J·沙姆斯（Nathaniel J. Shams）

美国纽约州布朗克斯河谷区希伯来之家医院（The Hebrew Home at Riverdale, Bronx, NY, USA）医学部

摘要

在急性后期护理和长期护理环境中，老年人中孤独感、抑郁和焦虑情绪普遍存在，并且这些情绪与不良健康结果相关。现有的心理社会干预措施往往面临可扩展性和持续参与度方面的挑战。

这项初步的可行性研究评估了一种基于人工智能、通过语音驱动的电话干预方法，旨在促进与老年人的对话互动。共有33名居民被联系到，其中28人参与了研究，他们主要来自专业护理机构（skilled nursing facilities）和辅助生活设施（assisted living facilities），还有一些人来自独立生活环境；在4周的评估期间，有23人完成了基线和后续评估。

参与者表现出抑郁和焦虑症状的减轻，尤其是在基线症状较重的参与者中变化更为显著。患者健康问卷-9（Patient Health Questionnaire–9）得分≥10的参与者平均减少了5.7分，总体而言，广泛性焦虑障碍7项量表（Generalized Anxiety Disorder 7-item scale）的得分中位数下降了2.3分。

鉴于这项研究的探索性质和方法学局限性，这些初步发现应谨慎解读。需要进一步的研究来评估该干预措施在更大规模、随机对照试验中的有效性和普遍性。

问题与意义

在急性后期护理和长期护理（PALTC）环境中，包括专业护理机构（SNFs）和辅助生活环境中的老年人，面临更高的孤独感、抑郁和焦虑风险。¹ 从独立生活状态过渡到这些环境通常会增加孤立感和痛苦。² 在专业护理机构中，61%的居民报告有中度孤独感，35%的居民报告有严重孤独感。³ 社交孤立与心血管疾病、中风、认知衰退和死亡风险增加有关。⁴ 2023年，美国卫生局局长将孤独感称为“严重的公共卫生问题”。⁵ 基于小组的非药物干预措施显示出一定效果，但常常存在实施不一致、人员需求高和可持续性有限的问题。6, 7, 8 许多干预措施是针对特定子群体设计的，因此难以大规模推广或复制。⁷^{,⁸ 这些局限性凸显了在PALTC环境中需要新型、可扩展的情感支持方法。}

创新

我们开发了Meela，这是一种基于人工智能（AI）的语音系统，旨在通过标准电话通话为老年人提供结构化的对话互动。参与者可以在预定时间接收自动拨入的电话，或者拨打一个专用号码发起通话。无需互联网、屏幕或新设备；用户只需像正常交谈一样拿起电话即可。

在每次通话中，Meela使用语音识别技术转录参与者的回答，通过对话语言模型进行处理，并通过合成声音给出回应。对话遵循一定的结构——问候语、问候问题以及开放式提示。该系统会保留之前对话中的某些细节，如个人兴趣或经常提到的家庭成员，并在未来的通话中引用这些信息。（参见补充图1中的示例对话。）

该系统是为老年人设计的，不需要数字素养或特殊设备。它利用现有的基础设施，结合自我导向的通话模式和最小的工作人员参与度，使其能够在专业护理、辅助生活和独立生活环境中实施。

实施

我们通过收集基本信息（姓名、电话号码和个人兴趣）来招募和登记参与者，以便个性化互动。使用标准化同意书获得了参与者的知情同意（见补充图2）。

纳入标准包括：能够听见声音、清晰表达、能够操作电话、能够进行对话、理解自己正在与AI系统互动，并能提供知情同意的居民。工作人员对参与者进行了预筛选，以确保他们具有足够的认知能力来做出同意和参与决策；没有进行正式的认知测试（例如简易精神状态检查（Mini-Mental State Examination）和蒙特利尔认知评估（Montreal Cognitive Assessment）。排除标准包括严重的听力或言语障碍，或妨碍有效参与的认知障碍。

参与者可以选择每周希望接收的预定通话次数（最多7次），并且可以拨打专用号码发起通话。工作人员的参与度很低，仅限于基本指导。干预期为4周，在此期间参与者可以继续进行日常活动（社交、娱乐和治疗项目），这些活动没有受到限制或改变。

系统会在预定时间自动拨打电话，参与者像接普通电话一样接听。在通话过程中，他们会自然地回答问题或提示。系统实时转录他们的话语，使用对话语言模型生成回复，并通过合成声音传达。对话包含一系列开放式问题和问候语，并根据参与者的偏好进行发展。系统会保留之前通话中的某些细节（如姓名、兴趣或反复出现的主题），以便在未来互动中个性化。（参见补充图1作为示例。）

我们将所有数据存储在一个符合《健康保险便携性和责任法案》（Health Insurance Portability and Accountability Act）以及系统和组织控制要求（Systems and Organization Controls 2）的平台中，该平台具有加密和基于角色的访问控制功能。结果使用患者健康问卷-9（PHQ-9）和广泛性焦虑障碍7项量表（GAD-7）在基线和随访时进行评估。

评估

工作人员确定33名居民符合条件；28人同意参与，5人拒绝（参与率为84.8%）。其中23人完成了基线和后续评估，并被纳入最终分析。排除的情况包括：3人在随访期间失去联系，1人认知能力显著下降，2人拒绝让数据被纳入分析。样本偏向于接受较高水平护理的居民：16人（69.6%）住在专业护理机构，6人（26.1%）住在辅助生活机构，1人（4.3%）住在独立生活机构。参与者的年龄范围从48岁到92岁（平均年龄=76.4岁，标准差=10.16岁），其中包括16名女性和7名男性。

基线时的PHQ-9抑郁得分范围为0到17分（平均分=7.78分，标准差=5.14分），表明存在轻度抑郁症状。干预后，抑郁得分平均减少了2.00分[标准差=4.17分；t(22) = 2.30，P = 0.031]。在基线时抑郁症状中度至重度的参与者（PHQ-9 ≥10；n = 9）中，抑郁得分平均减少了5.67分[标准差=4.09分；t(8) = 4.15，P = 0.003]。

基线时的GAD-7焦虑得分范围为0到17分（平均分=6.26分，标准差=5.44分）。由于分布不均匀，我们使用Wilcoxon符号秩检验来比较干预前后的得分，结果显示焦虑得分的中位数显著减少了2.30分（标准差=4.26分；z = −2.60，P = 0.017）。在基线时焦虑症状中度至重度的参与者（GAD-7 ≥10；n = 5）中，焦虑得分平均减少了6.40分[标准差=3.65分；t(4) = 3.92，P = 0.017]。图1使用箱线图展示了抑郁和焦虑得分的减少情况。

对PHQ-9抑郁得分和GAD-7焦虑得分进行了事后功效分析（n = 23）。PHQ-9的事后功效为72%，GAD-7的事后功效为83%。所有统计分析都在95%的置信区间内进行。使用SAS 9.4作为统计分析工具。

这项初步研究评估了Meela的可行性，这是一种基于AI的语音系统，旨在为PALTC环境中的老年人提供对话互动。参与者在4周的评估期间通过预定和按需的通话进行了互动。初步分析显示，抑郁和焦虑症状有所减轻，尤其是在基线症状较重的参与者中。

鉴于存在一些限制，应谨慎解读这些结果：样本量较小、没有对照组、随访期较短，以及地理和人口统计学多样性有限。参与者继续进行日常活动（社交、娱乐和治疗课程），这些活动可能影响了他们的情绪状态。这些潜在的混杂因素在初步设计中未得到控制。

虽然没有进行正式的认知测试（简易精神状态检查和蒙特利尔认知评估），但工作人员对参与者进行了预筛选，以确保他们具有同意和对话的能力。该研究在机构首席医疗主任的监督下进行，符合IRB豁免的机构标准，属于低风险可行性评估。

尽管存在这些限制，研究结果仍令人鼓舞，表明基于AI的语音陪伴可能为PALTC环境中的情感支持提供一种低门槛、可扩展的工具。未来的工作应包括更大规模的随机对照试验，并延长随访时间，以验证结果并探索特定人群的益处。

数据声明

鉴于本研究问题的敏感性，我们向调查受访者保证他们的原始数据将严格保密。

生成式AI使用声明

作者承认在手稿编写过程中使用了AI辅助技术，包括ChatGPT（OpenAI）来提高写作清晰度和语法准确性，Perplexity AI用于参考文献识别，Scite AI用于参考文献验证和语气调整。所有由AI生成的内容都经过了仔细审查和编辑，以确保准确性和完整性。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部