智能手机通话语音生物标志物追踪快速眼动睡眠行为障碍与帕金森病的疾病进展

时间:2026年1月1日
来源:Annals of Neurology

编辑推荐:

本研究通过智能手机无感采集日常通话语音,结合声学特征与人工智能嵌入分析,首次证实语音生物标志物可敏感追踪孤立性快速眼动睡眠行为障碍(iRBD)及早期帕金森病(PD)患者24个月内的疾病进展,为神经保护性临床试验提供了可扩展的数字化评估新范式。

广告
   X   

研究背景与意义
突触核蛋白病如帕金森病(PD)的神经保护疗法开发亟需能够敏感追踪疾病进展的生物标志物。孤立性快速眼动睡眠行为障碍(iRBD)作为PD的关键前驱标志,为在症状出现前观察疾病演变提供了独特窗口。当前数字评估多依赖主动任务,而真正可扩展的生物标志物应能在真实世界中无感获取。言语功能障碍(运动减少性构音障碍)是帕金森病最早出现的体征之一,日常智能手机通话为被动、大规模监测言语变化提供了前所未有的机会。本研究旨在验证基于智能手机通话的语音分析能否作为iRBD和早期PD的进展性生物标志物。
研究方法
研究纳入了捷克裔的iRBD患者、早期PD患者及年龄性别匹配的健康对照,进行了为期24个月的纵向观察。所有参与者均在基线、1年和2年时接受全面临床评估,包括运动障碍协会统一帕金森病评定量表第三部分(MDS-UPDRS-III)、蒙特利尔认知评估(MoCA)等。关键创新在于部署了一款定制智能手机应用,在用户知情同意下,于日常通话中被动、连续地采集受试者语音。应用采用自适应滤波技术去除远端说话人声音,确保只分析受试者语音。采集的语音经过静音段剔除(>0.7秒)和分段(20秒为单位)处理后,提取了四类具有病理生理学解释的声学特征:单音调(通过基频标准差F0sd衡量)、不精确元音发音(通过共振峰比率指数FRI衡量)、嗓音质量(通过倒谱峰突出CPP衡量)和发音速率(通过净语音速率NSR衡量)。此外,还设计了三个基于不同计算原理的言语损伤严重度全局描述符:基于长时平均频谱均值的频谱均值指数(LTAS mean)、基于梅尔频率倒谱系数标准差的倒谱变异性指数(global MFCC)以及基于TRILL-distilled模型深度学习嵌入均值的神经嵌入指数(Embeddings mean)。统计分析采用线性混合效应模型评估进展,并计算了不同药物疗效假设下神经保护试验所需的样本量。
研究结果
最终分析数据集包括23名PD患者、22名iRBD患者和26名对照者。在24个月内,共收集了超过31,000通电话(>1,000小时预处理语音)。与对照组相比,iRBD和PD患者在基于频谱变化的言语损伤严重度终点上均显示出显著下降。iRBD患者还表现出元音清晰度和发音速率的显著下降。在实验室言语评估中,仅iRBD组显示出元音清晰度的纵向下降。样本量估算显示,针对50%药物疗效的2年神经保护试验,基于神经嵌入指数的时间-事件分析最有效,iRBD组和PD组每臂分别需要74名和84名参与者。相关性分析发现,在PD组中,单音调、嗓音质量和神经嵌入指数的变化与MDS-UPDRS-III总分及其亚评分(尤其是强直和运动迟缓)的变化显著相关,提示这些语音特征与运动症状进展存在联系。
讨论
言语损伤严重度终点的进展
频谱均值指数(LTAS mean)能够捕捉iRBD和早期PD的疾病进展,可能得益于真实环境(如背景噪音引发的Lombard效应)使语音更动态,增强了病理与健康语音的对比。倒谱变异性指数(global MFCC)在本研究中未显示进展敏感性,可能因其对设备和环境噪声敏感。神经嵌入指数则对两组患者的言语变化均敏感,它可能捕获并丰富了MFCC所代表的倒谱信息,同时融入了互补的韵律和构音线索,且对噪声更稳健。
iRBD中特定言语模式的进展
iRBD患者元音清晰度的进行性恶化反映了舌部运动范围和构音运动的逐渐减少,根据Braak分期模型,这可能出现在疾病早期(Braak 2期)。发音速率减慢可能与潜在的认知损害有关,是向路易体痴呆或认知障碍型PD转化的信号。而单音调和嗓音质量未显示显著进展,前者可能在对话中被代偿,后者易受环境噪声影响。
iRBD的临床试验考量
基于神经嵌入指数的时间-事件分析所需的样本量(74人/臂)优于以往结合多领域终点的大型iRBD试验,展示了其作为高效临床试验终点的潜力。
早期PD的临床试验考量
尽管PD组年龄较对照组轻且接受了逐渐增加的多巴胺能药物治疗(可能减缓某些言语标志物的进展),基于神经嵌入指数的样本量估算(84人/臂)仍具吸引力。在未来稳定或不用多巴胺能药物的试验中,所需样本量可能更小。
言语变化与运动症状的关系
在PD组中,言语变化与运动症状的相关性主要体现在那些对左旋多巴治疗反应较好的特征上(如单音调、嗓音质量),提示这些特征与黑质纹状体多巴胺能系统功能相关。神经嵌入指数与MDS-UPDRS-III总分相关而非特定亚评分,表明其可能捕获了反映整体神经退行性过程的复杂、多维言语退化信息。
优势与局限性
自然通话提供了更敏感的早期神经运动衰退窗口,其表现优于年度实验室录音。智能手机监测负担小,易于扩展。本研究使用单一手机型号确保了音频质量一致性,但未来需验证跨设备普适性。每月10分钟通话要求可能限制适用人群,可通过主动支持或多渠道(如语音消息)解决。研究对象男性为主反映了iRBD的性别分布特点。基于捷克语的研究结果预计可推广,因帕金森病言语变化具有跨语言一致性。
结论
智能手机语音分析作为一种可扩展、低负担的数字化言语生物标志物,在追踪突触核蛋白病疾病进展方面展现出巨大潜力。该方法适用于神经保护试验、个性化治疗、人群筛查等多种场景,为临床研究和实践提供了新范式。未来需要在更大规模、多中心队列中进行验证以推动临床转化。

生物通微信公众号
微信
新浪微博


生物通 版权所有