1. 引言
定期进行身体活动(PA)对老年人的健康至关重要,它有助于改善心血管健康、增强心理健康以及提升认知功能。然而,目前老年人的 PA 水平普遍较低,很多人无法达到推荐的运动量,这与多种不良健康后果相关,如心血管疾病、2 型糖尿病、癌症风险增加以及心理健康问题和认知能力下降。阻碍老年人进行规律 PA 的因素包括身体限制、缺乏动力和难以获得合适的 PA 项目等。因此,开发有效的策略来促进和维持老年人的 PA 具有迫切的社会需求。
人工智能(AI)涵盖多种技术,可使机器模拟人类智能,其中机器学习(ML)、深度学习(DL)和强化学习(RL)是重要分支。社交机器人集成了这些 AI 技术,旨在与人类进行自然的社交互动。在健康领域,AI 和社交机器人已应用于疾病预测、健康监测和行为干预等方面。
AI 驱动的社交机器人能够为老年人提供个性化的 PA 建议、实时反馈,并通过激励性互动来提高他们的参与度。这些机器人可以根据个体需求分析数据并调整干预措施,帮助老年人克服保持规律 PA 的障碍。此外,它们的社交互动能力在维持老年人的参与度方面也起着关键作用。尽管相关研究不断增加,但目前该领域的文献较为分散,缺乏对 AI 驱动的社交机器人在促进老年人 PA 方面具体作用的深入理解。本系统综述旨在填补这一空白,评估这类机器人的有效性,分析过往研究的方法,并探索成功将其融入老年人日常锻炼的关键因素。
2. 方法
本综述遵循系统评价和荟萃分析扩展的首选报告项目(PRISMA-ScR)指南,并在国际系统评价前瞻性注册平台(PROSPERO)注册(注册号:CRD42024563725)。
2.1. 研究选择标准
纳入标准包括:实验研究,如随机对照试验(RCTs)、前后干预研究;采用 AI 技术,通过 ML、DL 或 RL 算法使机器模拟人类认知功能;使用 AI 驱动的社交机器人,能动态分析用户数据并实时调整行为,用于个性化干预或决策支持;研究对象为老年人;主要结局变量包括 PA 测量指标;原始、实证、同行评审的期刊出版物;检索时间范围从电子文献数据库建立至 2024 年 3 月 1 日;英文撰写。
排除标准为:非实验研究,如观察性研究、综述、社论、信件、病例报告或研究方案;使用非 AI 驱动的社交机器人的研究;不以老年人为主要研究对象的研究;未将 PA 作为主要结局变量的研究;非英文文章。
2.2. 搜索策略
在 PubMed、Web of Science、Scopus、Cochrane Library 和 IEEE Xplore 这 5 个电子文献数据库中进行全面的关键词搜索。搜索策略结合了与社交机器人和身体活动相关的术语,以确保全面覆盖相关研究。两名作者(JY 和 HZ)根据研究选择标准独立筛选文章标题和摘要,重点关注 AI 技术是否是干预的核心。获取潜在相关文章的全文并详细审查,评估是否存在 AI 特征,如使用 ML、DL 或 RL 算法。通过 Cohen's kappa(κ = 0.78)评估两名作者之间的评分者一致性,如有分歧由第三名作者(JS)解决。
2.3. 数据提取和合成
使用标准化的数据提取表确保数据提取的一致性和全面性。两名作者(JY 和 HZ)独立从每项研究中提取数据,包括关键方法学和结局变量,如第一作者、发表年份、国家、研究设计、样本量和特征、健康状况、女性比例、年龄、社交机器人类型、研究地点或环境、机器人的技术规格和配置、干预细节、运动类型、每次运动时长、运动频率、干预持续时间、机器人在运动中的作用、结局测量指标和关键发现。必要时由第三名作者(JS)解决分歧,以确保数据提取的准确性和一致性。
2.4. 研究质量评估
使用美国国立卫生研究院的无对照组前后(Pre-Post)研究质量评估工具对纳入研究的质量进行评估。每项符合标准的研究得 2 分(“是”),部分符合得 1 分(“部分”),不符合得 0 分(“否”),所有标准的累积得分即为研究的总体质量得分,范围为 0 - 24 分。评估过程中如有分歧,由两名共同作者(JY 和 HZ)与第三名共同作者(JS)协商解决,以确保评估的完整性和一致性,但研究质量评估不影响研究的纳入。
3. 结果
3.1. 研究识别
初步关键词搜索共识别出 6979 篇文章,去除重复后,有 6280 篇独特文章进入标题和摘要筛选阶段。其中,6234 篇因不符合纳入标准被排除,主要原因包括未关注老年人、未涉及 AI 驱动的干预或社交机器人、与 PA 促进无关、为综述或评论而非原创研究以及非英文撰写等。对剩余的 46 篇文章进一步应用研究选择标准,排除 27 篇,最终 19 篇文章纳入本综述。
3.2. 研究特征
这 19 项研究发表于 2010 年至 2023 年之间,研究地点分布在多个国家,包括美国(n = 4)、芬兰(n = 2)、日本(n = 2)等。样本量差异较大,从 4 到 77 人不等,平均样本量约为 30 人。研究对象主要为老年人,部分患有慢性阻塞性肺疾病、痴呆或其他行动和认知障碍。研究在多种环境中进行,如老年生活设施、疗养院、社区中心、大学、康复诊所、参与者家中、老年护理机构和实验室等。使用的社交机器人类型多样,包括人形机器人(如 NAO、Pepper、Baxter)、移动机器人伴侣(如 ROREAS)和动物外形机器人(如 PARO)。
3.3. 干预设计和结局测量
这些研究使用了各种具有不同技术规格和配置的社交机器人来促进老年人的 PA。人形机器人应用最为广泛,在 13 项研究中出现,它们具备先进的功能,如摄像头、麦克风、传感器和音频反馈能力。其他机器人如移动机器人伴侣和动物外形机器人也各有特定功能,如自主导航、情感和社交互动、触觉感知和基于语言的交互等。
干预内容丰富多样,机器人辅助进行的运动包括力量和灵活性训练、有氧运动以及认知互动活动等。机器人在干预中承担多种角色,如提供指导、示范运动、给予反馈和激励、实时监测以及提供社交支持等。运动时长从约 10 - 20 分钟的短时长到长达 90 分钟的长时长不等,运动频率从单次到每周多次,干预持续时间也有所不同,包括短期(1 - 2 周)、中期(4 - 8 周)和长期(12 - 16 周)。
3.4. 主要发现
AI 驱动的社交机器人在不同环境中成功激励老年人参与 PA。例如,一些研究表明,社交辅助机器人能提高老年人的运动依从性和乐趣,尤其是当参与者可以选择自己喜欢的运动游戏时;作为步行训练器的机器人能有效鼓励老年人多走路;在促进正确关节弯曲方面,机器人比人类教练更有效;机器人辅助训练可延长中风康复患者的运动时长和频率;长期运动中,机器人能维持参与者的参与度并产生积极的 PA 结果。然而,机器人在促进 PA 方面的有效性会因环境、用户特征和设计而异。在结构化环境(如疗养院和康复中心)中,机器人有助于维持规律的运动习惯;在社区和老年护理中心,机器人通过促进团体运动来提高 PA 和社交参与度;在家庭环境中,机器人提供个性化支持,但面临空间限制、技术问题和用户熟悉度等挑战。
用户对机器人辅助训练的接受度和满意度较高,他们普遍认为机器人的互动具有吸引力和激励性,并愿意在未来继续使用。参与者对机器人的关系策略(如赞扬和共情)评价积极,连续和组合的视听反馈能增强用户参与度和满意度。不过,技术问题(如启动时间长、面部识别差和通信延迟)会降低满意度,部分参与者对机器人辅助训练的长期有效性和潜在的习惯化效应表示担忧。不同类型的机器人(如人形机器人和动物外形机器人)因其设计特点在促进用户参与方面各有优势。
虽然研究主要关注 PA 和用户接受度,但一些研究也表明社交机器人具有潜在的健康益处,如改善药物依从性、睡眠模式和整体幸福感等。然而,部分研究在健康结果方面存在混合结果,需要进一步研究以充分了解机器人辅助干预对健康的影响。
3.5. 研究质量评估
纳入研究的平均质量得分为 16.3 分(满分 24 分),范围为 14 - 18 分。所有研究都明确阐述了研究问题或目标,详细说明了研究人群,干预措施描述清晰,大多数研究可靠地评估了明确、有效且一致应用的结局指标,并且保留率较高,19 项研究的随访丢失率均低于 20%。但只有 1 项研究满足足够大样本量的标准,仅一半的研究进行了全面的统计分析,所有研究均未对结局评估者进行盲法,且只有 5 项研究采用了 RCT 设计,这是研究方法上的重要局限。未来研究应优先采用 RCT 设计并扩大样本量,以提高研究结果的有效性。
4. 讨论
4.1. 人工智能驱动的社交机器人在促进老年人身体活动方面的作用
促进老年人的 PA 对维持其健康、独立性和生活质量至关重要,但老年人在参与 PA 时面临诸多挑战。AI 驱动的社交机器人为解决这些问题提供了有前景的方案,它们能提供个性化的运动指导、鼓励和陪伴。本综述显示,这类机器人能有效激励老年人参与各种体育活动,提高运动依从性、参与度和训练时长,用户接受度和满意度较高,还具有潜在的健康益处,对改善老年人生活质量具有重要潜力。
不过,社交机器人在促进 PA 方面的有效性在不同亚组、环境和设计中存在差异。例如,不同健康状况的老年人参与的运动类型不同,且部分研究未观察到机器人对某些指标(如特定研究中的运动活动)有显著影响。与其他新兴技术(如移动健康应用程序和虚拟现实运动项目)相比,社交机器人具有独特的优势(如多感官互动),但也面临成本高、大规模部署困难和维护需求大等挑战,且用户参与度可能会随时间下降。研究发现,技术的新颖性、机器人的设计、参与者的个体差异以及干预的持续时间和频率等因素都会影响社交机器人在促进 PA 方面的有效性,需要更多长期、一致频率的干预研究来确定其长期效果。
4.2. 用户接受度、参与度和设计因素
老年人对 AI 驱动的社交机器人的接受度和满意度普遍较高,这得益于机器人的关系策略(如赞扬和共情)、激励用户的能力以及个性化和自适应的互动。这些发现与老年人对技术接受的现有研究一致,强调了易用性和感知有用性的重要性。
然而,仍存在一些挑战,特别是技术问题(如启动时间长、面部识别差和通信延迟)会损害用户体验,这也是其他辅助技术面临的普遍问题。为提升用户体验,需要通过改进设计和功能来解决这些技术问题,如加快响应时间、增强识别能力和简化用户界面。此外,用户培训、新颖性效应以及机器人的特定功能等因素会导致用户接受度的差异,了解并解决这些因素对优化机器人设计和实施、确保持续的用户接受度和满意度至关重要。
4.3. 局限性和未来研究
现有研究存在一些局限性,如样本量小影响研究结果的普遍性,短干预持续时间难以评估长期有效性和可持续性,自我报告测量可能存在偏差(如受社会期望或与机器人互动的新颖性影响),以及使用无对照组的前后研究设计难以确定观察到的变化是否真正归因于干预。因此,未来研究需要纳入更大、更多样化的样本,延长干预时间,采用客观的 PA 和用户体验测量方法,并设置对照组以减少潜在的混杂变量。
本系统综述也存在一些限制,如可能存在发表偏倚(阳性结果的研究更易发表),研究设计和结果的异质性使得难以得出明确结论,也无法进行荟萃分析。
5. 结论
社交机器人在激励老年人参与 PA 方面具有有前景的潜力,表现为运动依从性提高、参与度增加和训练时长延长。较高的用户接受度和满意度进一步表明这些技术能够提升运动体验。虽然直接健康相关结果测量较少,但在药物依从性、睡眠模式和整体幸福感方面的改善表明社交机器人能为老年人的健康提供全面支持。然而,由于当前研究设计的局限性,这些结果应谨慎解释。未来研究应解决这些局限性,采用更严格和受控的研究设计,延长干预时间,使用更大和更多样化的样本,并改进技术以确保用户友好、适应性强且能提供个性化和引人入胜的互动,从而推动 AI 驱动的社交机器人的发展和应用,促进老年人更健康、更积极的生活方式,提高他们的整体生活质量。