引言
构音障碍(Anarthria)是一种因运动通路生理性紊乱或损伤导致的言语表达缺失。患者虽然保留语言理解和产生能力,但口面部麻痹使其无法执行言语动作。其病因包括肌萎缩侧索硬化(ALS)、卒中、创伤性脑损伤等影响下行运动通路的疾病。对于伴随瘫痪的患者而言,丧失沟通能力对其生活质量影响巨大。本综述旨在探讨用于改善构音障碍患者沟通效率的干预策略演变,主要分为三个标志性技术时代。
植入前时代
在植入设备获得关注之前,沟通设备主要围绕非侵入性技术。这包括眨眼二进制沟通系统、字母板、以及增强与替代沟通(AAC)设备,如眼动和头部追踪器。在眨眼系统中,患者通过特定次数的眨眼来表示“是/否”或进行选择,这常是患者发病初期的主要沟通方式。随后,患者可能进展到使用字母板,通过目光选择字母来拼出信息。对于未完全瘫痪的患者,键盘和触摸屏可在失声时提供书面沟通。
随着对提升沟通效能兴趣的增长,脑机接口(BCI)被整合进来。BCI是一个解码用户神经活动并将信息传输至外接设备以执行预期功能的计算机系统。在言语沟通中,BCI解码意图言语,并通过选择、打字或最终的文字生成进行有效沟通。例如,眼电图(EOG)被用于非侵入性记录眼球运动的电信号,使患者能通过眼球运动进行选择。此外,言语生成设备(SGD)可将书写的文字转化为语音输出,已故物理学家霍金在电视采访中使用的便是此类技术。
尽管眼动追踪设备的技术改进使其更精准,但其应用仍依赖于理想的光照和姿势条件。有研究利用置于顶叶上方的非侵入性BCI,通过事件相关电位(P300)解读皮层活动,使患者无需头部或眼部运动即可拼写单词。然而,这些非侵入性BCI的拼写方式仍然繁琐,沟通速度远未达到流畅对话的水平(正常人语速约为每分钟120-150个词),这促使了植入式BCI的研究。
植入时代
进入21世纪,皮层下植入技术的尖端发展标志着构音障碍治疗的当前时代。植入式BCI最初也未能完全解决拼写繁琐的问题。早期研究将植入式BCI与听觉P300拼写系统结合,供闭锁综合征患者沟通。另有研究使用类似的植入式BCI,通过协调神经活动与光标点击来打字传递信息,实现了每分钟27个正确字符的打字速度。还有研究利用完全植入的硬膜下BCI,将尝试的手部动作与打字程序协调,或通过解读尝试的书写手势将其转化为计算机生成文本,后者实现了每分钟90个词的打字速度。
技术的进步带来了革命。如今,无需依赖拼写,整个单词可以被解码和解释。植入式BCI作为一种新的AAC形式,超越了追踪控制或拼写,通过合成语音实现更有效的沟通。神经假体(或称植入式皮层神经假体,ICN)利用算法,将BCI在自主言语期间记录的神经活动翻译成文本、声音和面部运动。这允许神经假体从大脑活动中解码相应的单词、短语和句子,并在屏幕上显示或朗读出来。虽然植入式BCI具有更高的时空分辨率、更强的抗干扰能力,并能更特异性地靶向神经群体,但它们也具有高风险、植入后缺乏灵活性以及昂贵等缺点。
2009年的一项研究测试了在左侧中央前回植入电极的脑机接口,用于读取与言语规划相关的皮层活动,为电极植入技术解码尝试性言语奠定了基础。皮层电图(ECoG)通过在脑皮层表面放置电极来记录神经活动,是神经假体中记录神经数据的关键。在应用于构音障碍患者之前,基础性神经假体工作已在能正常说话的患者(如接受癫痫治疗的患者)身上进行,测试其解码合成语音的准确性和可比性。
与此同时,针对构音障碍患者的单词和短语神经假体测试也在进行,准确率随时间推移不断提高。一项研究通过对22小时皮层活动记录,使用解码算法预测与神经模式最匹配的词汇,在50个单词的词汇量上实现了25.6%的词错误率和47.1%的词准确率。另一项研究采用了三步解码模型(解码、验证、分类),将两名卒中致构音障碍参与者的解码分类准确率分别提高至87.7%和98.5%,并且由于验证步骤的存在,实现了零误报。
上述研究中的神经假体均在提示性沟通上进行训练和分析。然而,2024年的一项研究分析了神经假体在自由、非提示沟通中的使用。参与者被植入了微电极阵列,解码系统依赖语言学习模型将神经活动解释为预测的音素、单词,最终组织成句子。在超过22,000个句子的测试中,实现了2.7%的词错误率。在自由对话中,神经假体能100%正确解释52.9%的句子。该研究还结合了SGD,以参与者患构音障碍前类似的声音朗读解码出的句子。
目前,侵入性方法如ECoG或微电极阵列是已开发出的最精准、最特异的言语解码技术。它们允许实时解码单词和句子,为失去重要社交技能的患者提供了更高效的沟通机制。然而,植入的侵入性和永久性是该技术对许多患者而言的主要障碍。
未来
神经假体沟通康复的未来在技术创新和应用上呈现多元化。当前,精准的神经假体依赖于侵入性的皮层读取,并通过外接基座和线缆连接到计算机,这带来了舒适度、移动性、美观性以及炎症或胶质瘢痕等问题。2014年开始发展的无线皮层电图阵列,未来应用于BCI沟通,可能解决因与计算机直接外接连接带来的美观、移动和舒适问题。例如,可外部充电的无线电极ECOGIW-16E已在自由活动的灵长类动物研究中被证明可有效用于皮层读取和刺激。尽管无线ECoG将改善移动性,但仍需侵入性脑部手术进行植入。目前尚无比侵入性方法更精确的非侵入性神经读取技术可用,但为提高可及性,研究已致力于改进脑电图(EEG)、事件相关电位(ERP)等非侵入性BCI的准确性和特异性。
提高神经记录和解码准确性的新方法也在探索中。一项研究开发了与ECoG相对的“互信息”测量法,这种方法利用线性和非线性依赖关系解码神经活动,被发现能比标准方法更早地检测到言语开始前的前额叶和前运动皮层激活,并且对大脑内言语激活和执行时空成分更敏感。
目前的神经假体已被证明能准确解码参与者的单词和句子,但尚未针对语调、节奏和面部表情等个性化言语方面进行测试。已有研究能够通过计算机生成与参与者瘫痪前相似的声音来合成语音,朗读预测的句子。此外,为反映非语言沟通的重要性,研究开发了面部虚拟形象脑机接口,解码与言语手势相关的神经活动,为参与者创建一个虚拟的、可运动的面部形象。人类沟通是词语、非语言线索和手势的结合。创造一个能够反映口面部表情的虚拟形象,对于神经假体设计全方位改善瘫痪患者的沟通至关重要。
展望神经假体的未来,语言的多样性和非日耳曼语系字母的包容性应被探索,因为当前的神经假体开发主要以英语为中心。2025年,一个双语神经假体记录器被开发并在一位精通英语和西班牙语的个体上测试,解码模型依赖于参与者言语运动皮层中两种语言共享的神经通路,无需为每种语言创建单独的编码器。同年,一个普通话BCI被开发,能够从神经活动中解码394个音节,准确率达到71.2%,这为超越音素限制的未来发展提供了基础。
神经假体技术并不仅限于沟通康复。电极植入用于皮层活动解码的原理,在机器人假肢、昏迷患者的脑活动读取,以及治疗多发性硬化、脑膜炎和创伤性脑损伤等其他导致构音障碍的疾病方面具有广泛的应用前景。此外,还有研究测试虚拟现实作为BCI用于具身康复的领域。这项技术的巨大潜力值得在准确性、可及性和应用方面进行更深入的研究。
沟通是人类社交不可或缺的一部分,对于因构音障碍失去此能力的患者,神经假体是他们重建联系的契机。因此,未来的研究对于增强这项技术,为所有人(无论运动能力如何)提供沟通桥梁至关重要。
讨论与结论
本综述分析了沟通技术如何演进并持续发展,以改善构音障碍患者的生活质量。沟通对于人类社交至关重要,因此许多丧失沟通能力的患者遭受孤立和抑郁。尽管当前神经假体已被证明有效,但未来的方向集中在提高沟通技术的移动性、可及性和编程上。值得注意的是,在霍金使用SGD说话的30年里,他逐渐将合成器的声音视为自己的“声音”。这提示,在研究如何模仿发声生成机制的同时,也应涵盖一个人认为什么是其“声音”的主体性。
神经假体在沟通之外也有多种应用,脑机接口也被用于肢体瘫痪、卒中、心理健康康复,以及与虚拟现实临床护理结合。改进的神经假体技术对恢复数千名因构音障碍导致沟通能力丧失而遭受孤立患者的流畅沟通具有重要意义。神经假体不断扩展我们对皮层活动功能和机制的理解,并为未来需要即时神经活动解码的临床干预奠定了坚实基础。
总之,构音障碍言语沟通设备的演进跨越了非植入式、植入式和未来治疗。非植入式方法包括二进制眨眼系统、字母板和AAC设备,为患者提供了沟通途径,但在速度和完全瘫痪患者的能力方面受限。植入式设备使用BCI将皮层活动解释为单词和句子,以实现更高效的沟通,但仍受限于植入的侵入性和准确性。在面对尖端技术的临床决策时,应在患者需求的整体背景下理解构音障碍和言语沟通设备的现实。对于一些构音障碍病例,植入可能被认为过于侵入、昂贵或患者价值有限,因此即使植入能带来更准确、高效的沟通,也可能不是可行的治疗选择。未来神经假体的可及性将通过更少的移动限制、改进的软件、扩展模型所用语言以及包含直接文字翻译之外的沟通功能(如面部表情)得到改善。持续的技术努力,扩展沟通选择并提高其可及性,对于提供最佳的构音障碍护理至关重要。