综述:卒中面部表情识别(FER)的系统评价:诊断与康复新兴应用

时间:2026年5月21日
来源:Frontiers in Neurology

编辑推荐:

背景:卒中是全球长期致残和死亡的主要原因之一,早期识别与康复疗效评估具有重要意义。面部表情识别(FER)作为计算机视觉技术,为多种疾病的早期筛查与监测提供了潜在可能,然而其在卒中领域的应用尚待深入探索。目的:探讨FER技术在卒中识别与康复监测中的应用价值。方法

广告
   X   

背景:卒中是全球长期致残和死亡的主要原因之一,早期识别与康复疗效评估具有重要意义。面部表情识别(FER)作为计算机视觉技术,为多种疾病的早期筛查与监测提供了潜在可能,然而其在卒中领域的应用尚待深入探索。目的:探讨FER技术在卒中识别与康复监测中的应用价值。方法:研究人员系统检索了PubMed、Web of Science、CNKI及WanFang四个数据库,纳入从建库至2025年1月期间FER技术应用于卒中的相关研究。结果:共检索到1,855篇文献,最终9篇符合纳入标准(8篇诊断性研究、1篇康复试验)。8项研究证实了FER在卒中诊断中的效用,通过标准化任务期间的面部不对称分析,在公开/私有数据集上实现了82%~98%的准确率;KISS(佯装亲吻婴儿)、SPREAD(紧闭双唇佯装微笑)及非言语运动等特定任务效果尤为显著。1项研究通过实时面部表情分类以调整训练强度,在监测康复强度方面达到了99.81%的准确率。数据来源包括图像(66.7%)和临床患者数据库(55.6%)。结论:FER技术通过精确分析下颌及面部运动,在卒中诊断和新兴康复应用中展现出 substantial 潜力。然而,FER模型在临床转化中仍面临诸多挑战。未来研究可整合多模态数据与自然环境(in-the-wild)数据库,以促进FER技术的临床实施,从而改善医患双方的诊疗服务并降低患者的死亡率和致残率。
本综述旨在系统评价面部表情识别(FER)技术在卒中诊断与康复中的应用现状。研究通过检索PubMed、Web of Science、CNKI及WanFang数据库,纳入9篇符合标准的研究,从辅助诊断与康复监测两个维度展开分析。

**1 引言**

本部分阐述了卒中的全球疾病负担,指出其年均导致约650万人死亡,预计2030年将升至约800万。早期诊断与干预对降低发病率和死亡率至关重要,而现有诊断方法如辛辛那提院前卒中量表(Cincinnati Pre-hospital Stroke Scale)、面部手臂言语测试(Face Arm Speech Test)及急诊室卒中识别量表(ROSIER)虽具有一定灵敏度(83%~91%),但 特异度有限。面部不对称作为卒中的重要早期临床表现,其及时识别对早期诊断意义重大,但医疗延迟、漏诊和误诊等问题仍阻碍着及时救治。FER技术通过面部肌肉运动、眼部行为及眉毛动作传递情感与情绪状态,已在抑郁症诊断、自闭症谱系障碍识别等领域广泛应用。卒中后患者面神经功能受损,表现为单侧面部麻痹、口角下垂及鼻唇沟消失等特征性改变,使FER技术成为早期卒中检测的有前景工具。此外,FER在卒中康复中也显示出潜力,可提供毫米级面部肌肉对称性测量,实现数据驱动的康复方案调整。

**2 方法**

**2.1 检索策略**

研究人员系统检索了中英文电子数据库(PubMed、Web of Science、CNKI和WanFang),检索时间从建库至2025年1月。检索式采用主题词组合:(TS = (facial expression OR facial recognition OR emotion recognition)) AND TS = (stroke OR cerebrovascular accident OR apoplexy OR brain vascular accident OR vascular accident brain OR cerebral hemorrhage OR cerebral infarction OR post-stroke OR cerebral ischemia OR hemorrhage stroke OR ischemic stroke OR acute ishemic stroke OR cerebrovascular disorders)。检索策略由具有系统评价经验的团队设计,经筛选后由一名研究者手工检索纳入研究的参考文献以补充相关文献,第二名研究者审核确认。

**2.2 纳入排除标准**

纳入标准包括:(1)涉及依据国际公认标准(如WHO ICD-11、AHA/ASA指南)诊断的卒中患者,或直接使用卒中患者面部图像/视频的研究;(2)应用FER技术分析卒中患者面部表情;(3)量化自发表情或标准化情绪诱发任务(如微笑、抬眉)期间的面部肌肉运动(如不对称评分、面部动作单元(AUs)强度);(4)原始实证研究;(5)英文或中文发表。排除标准包括:关注卒中患者识别他人情绪能力的研究、非原始研究(如综述、社论、病例报告)、动物研究或非人类数据。

**2.3 数据提取**

采用Excel标准化提取表,由一名研究者独立提取第一作者、发表年份、国家、研究目的、设计、数据来源、情绪/标准化任务、参与者、数据类型(样本量)、结局指标、结果及应用场景等信息,第二名研究者核对,分歧通过研究组内讨论解决。

**3 结果**

**3.1 纳入研究特征**

共检索1,855条记录,去重后1,513篇进行题目摘要筛选,排除1,473篇;40篇全文及参考文献经检查,通过参考文献筛查补充4篇,最终9篇符合纳入标准。9篇文献发表于2011—2025年间,来自7个国家(巴西、中国、马来西亚、泰国、墨西哥、加拿大、瑞士)。除1项研究额外纳入面瘫患者数据外,其余8项均分析卒中患者与健康对照者的面部信息。样本类型分为个体和图像两类:3项仅用个体数据,4项仅用图像数据,2项兼用。数据来源方面,4项仅使用公开数据集,1项兼用公开与自建数据库,4项建立专有数据库。样本量25~253例不等,分析图像数量480~36,500张。

具体研究包括:Ou等(2025,中国)采用私有数据集进行横断面研究,253例参与者,AUC为0.882,准确率82.6%;Oliveira等(2024,巴西)基于多伦多神经面数据库(TNF)的病例对照研究,168个视频,准确率82%;Razlan等(2024,马来西亚)利用UTK Face Cropped数据集和面部下垂与面瘫数据集进行回顾性研究,2,000张图像,准确率92.67%;Phienphanich等(2023,泰国)基于FaceGAN和私有数据集,63例参与者及28,800张图像,AUC达0.91;Kaewmahanin等(2022,泰国)使用TNF数据集,496张图像,准确率97.89%;Parra-Dominguez等(2021,墨西哥)整合TNF和麻省眼耳医院数据库(MEEI),1,516张图像,准确率97.22%;Bandini等(2018,加拿大)私有数据集病例对照研究,23例参与者,准确率87%;Schimmel等(2011,瑞士)私有数据集病例对照研究,27例参与者,开发3D系统评估面部肌肉功能;Fan等(2022,中国)采用FER+、真实世界情感面孔数据库(RAF-DB)及私有数据集,42例参与者及36,500张图像,准确率99.81%。

**3.2 FER应用**

**3.2.1 FER辅助诊断**

3.2.1.1 基于公开数据集的诊断模型

四项研究基于公开数据开发卒中诊断模型。TNF是由多伦多大学建立的目前唯一同时包含神经系统疾病(卒中与肌萎缩侧索硬化症(ALS))所致口面部损伤、真实面部关键点标注及临床元数据的公开资源。该数据集为单中心横断面设计,含261个面部表情视频,来自36人(11名健康者、14名卒中患者、11名ALS患者),基于九项标准化任务(KISS、OPEN、SPREAD、PA、PATAKA、BBP、BROW、BIGSMILE和BLOW)采集。

Oliveira等选取TNF数据集中七项任务的动态视频,采用Python面部表隋分析工具箱(Py-Feat)识别和量化面部肌肉运动,发现KISS和SPREAD任务区分卒中患者与健康对照的准确率达82%,其余任务低于77%,提示下面部区域较上面部更适合卒中患者识别。Kaewmahanin等同样分析TNF数据,采用余弦相似度衡量高维空间中的向量相似性,在六项非言语任务(KISS、OPEN、SPREAD、BROW、BIGSMILE和BLOW)的动作峰值帧提取图像,识别29个面部关键点,计算各点与鼻部参考点向量并通过翻转左侧向量实现不对称分析,总体准确率达97.89%,子任务准确率98.2%~99.57%,发现下唇和眉毛是准确识别的主要视觉焦点。Parra-Dominguez等结合TNF和MEEI数据库(含10名健康者和50名麻痹患者),聚焦51个关键面部点,通过倾斜校正后计算关键点间距离量化面部不对称,对MEEI数据库卒中患者平均准确率94.06%,TNF数据集达97.22%,其分类模型可识别任何卒中患者面部表情,避免因无法执行指定动作导致的误诊。Razlan等利用Kaggle中UTK Face Cropped数据集和面部下垂与面瘫数据集,采用InceptionResNetV2处理图像,区分正常与麻痹面部表情的准确率达92.7%,支持实时网络摄像头和静态图像的连续监测。

3.2.1.2 基于私有数据库的诊断模型

三项研究收集临床卒中患者面部数据建立私有数据库。Schimmel等(2011,瑞士)招募27例卒中患者,分析三种标准化面部表情(force:攻击性微笑;pose:摆拍微笑;Ebl:最大抬眉)及休息状态,通过计算双侧绝对差异量化面部不对称,评估面部肌肉功能严重程度,发现3D系统对评估卒中患者面部肌肉功能具有高灵敏度,且下面部肌肉较上面部受累更重,有助于区分中枢性与周围性面瘫。Bandini等(2018,加拿大)纳入12例卒中患者和11名健康对照,执行八项任务,从184个视频记录中提取几何特征和分析运动轨迹,准确率56.5%~87%,差异可能源于样本量不足导致的欠拟合,发现涉及下面部肌肉活动的任务(BBP、BLOW和SPREAD)区分能力最强。Ou等(2025,中国)开发多模态模型整合面部运动分析与运动功能评估,基于FAST(面部-手臂-言语-时间)方案,纳入132例卒中患者和121名健康对照,采集面部运动视频、其他运动任务(抬手、抬腿、指鼻)及音频数据,视频模块和音频模块AUC均约80%。

3.2.1.3 基于混合数据的诊断模型

仅一项研究兼用公开和私有数据。Phienphanich等(2023,泰国)采用FaceGAN公开数据集(14,400对中性-微笑转换图像)作为训练集,纳入12名健康者和51例不同程度面部肌肉无力的卒中患者作为验证集,运用余弦相似度和自定义损失函数区分中性至微笑状态的表情轨迹,FaceGAN数据集AUC为0.76,真实受试者数据集AUC达0.91。这种两阶段验证方法直接应对临床转化挑战,在实际患者数据上展现出显著应用前景。

**3.2.2 FER辅助康复**

仅一项研究探索了FER在卒中康复中的辅助作用。Fan等(2022,中国)开发基于 Patch-卷积视觉变换器(FER-PVCT)的FER模型,从公开数据集RAF-DB(含快乐、悲伤、惊讶、愤怒、恐惧、厌恶、中性七种基本情绪)和FER+(增加轻蔑类别)获取健康受试者面部图像建立诊断模型,再建立包含37例卒中患者和5名健康对照的私有数据集,涵盖四种基本情绪(快乐、悲伤、惊讶、愤怒)和四种特殊情绪(痛苦、紧张、疲惫、中性),通过分类实时面部表情评估训练强度是否适宜。该模型在公开数据集准确率超88%,自有数据集达99.81%,但后者可能因样本量小存在过拟合。

**4 讨论**

**4.1 FER在卒中诊断中的价值**

本综述显示FER技术作为辅助工具在卒中诊断中具有重要价值。通过分析患者实时面部肌肉运动异常,FER可实现快速、无创的卒中检测和疾病严重程度评估,改善患者预后、延缓疾病进展。与传统神经影像学及综合运动评估等侵入性、昂贵且耗时的技术相比,FER作为无创替代方案,可促进连续监测以优化治疗策略。然而,临床转化和大规模实施仍有限,多数研究尚处实验室或初步验证阶段,对真实临床场景、标准化方案和长期系统稳定性探索不足。

**4.2 FER在卒中康复中的新兴应用**

FER在康复领域的应用原理与诊断高度相似。康复训练中的面部表情变化可反映疲劳水平,FER能识别这些细微变化以指示身体功能状态,辅助临床医师个性化调整训练强度。此外,随病情动态变化,患者面部肌肉功能障碍也相应演变,FER可通过识别同一患者在不同康复阶段面部表情的标准化差异,实现康复进展的动态监测与评估。但目前仅有一项研究涉足该领域,未来需进一步拓展。

**4.3 模型稳定性与挑战**

基于公开数据集的研究准确率较高(82%~97.89%),而临床数据研究准确率较低(56.5%~87%);多模态方法通过整合更多样数据源增强了诊断稳健性(AUC=0.882)。康复领域准确率高达99.81%但可能存在过拟合。这种显著波动限制了FER的角色定位,强调高标准化模型验证的必要性。此外,下面部运动减少是区分卒中患者的突出特征,与半球性卒中面部无力通常下面部更重的临床观察一致。但FER准确率受多种因素影响:头部位置失准可导致眉毛关键点丢失或移位;光照强度和阴影会改变深度学习模型中的外观特征;标准相机难以捕捉患者细微面部表情,而这些细微变化对卒中患者具有临床重要性。

**4.4 临床应用前景与挑战**

FER可作为急诊转运和临床评估中卒中初步识别与筛查的辅助工具:院前筛查方面,识别卒中相关面部改变;门诊分诊方面,提高卒中识别准确性、加速患者救治;康复阶段,提供实时面部监测以指导康复策略调整。但也面临挑战:医务人员对FER可接受性和准确性的怀疑、卒中已有成熟诊断路径下操作时间是否充足;患者配合指定动作的能力及面部隐私顾虑等。

**5 局限性**

本综述局限性包括:纳入研究数量较少限制结论泛化性和外部效度;出版偏倚可能影响对FER技术疗效的认知;缺乏荟萃分析数据阻碍定量综合和稳健统计结论的得出。

**6 结论**

FER技术通过分析下面部不对称变化提供有价值的定量辅助诊断指标,并能实时监测康复过程中患者参与度,是从卒中诊断到新兴康复应用的变革性无创工具。然而,其临床应用仍受光照条件、面部角度等多重因素制约,模型准确率不稳定。未来研究可采用自然环境数据集,将FER技术应用于卒中患者院前筛查、临床诊断和远程康复等场景,提高卒中患者获得正确治疗的效率。

生物通微信公众号
微信
新浪微博


生物通 版权所有