背景:卒中是全球长期致残和死亡的主要原因之一,早期识别与康复疗效评估具有重要意义。面部表情识别(FER)作为计算机视觉技术,为多种疾病的早期筛查与监测提供了潜在可能,然而其在卒中领域的应用尚待深入探索。目的:探讨FER技术在卒中识别与康复监测中的应用价值。方法:研究人员系统检索了PubMed、Web of Science、CNKI及WanFang四个数据库,纳入从建库至2025年1月期间FER技术应用于卒中的相关研究。结果:共检索到1,855篇文献,最终9篇符合纳入标准(8篇诊断性研究、1篇康复试验)。8项研究证实了FER在卒中诊断中的效用,通过标准化任务期间的面部不对称分析,在公开/私有数据集上实现了82%~98%的准确率;KISS(佯装亲吻婴儿)、SPREAD(紧闭双唇佯装微笑)及非言语运动等特定任务效果尤为显著。1项研究通过实时面部表情分类以调整训练强度,在监测康复强度方面达到了99.81%的准确率。数据来源包括图像(66.7%)和临床患者数据库(55.6%)。结论:FER技术通过精确分析下颌及面部运动,在卒中诊断和新兴康复应用中展现出 substantial 潜力。然而,FER模型在临床转化中仍面临诸多挑战。未来研究可整合多模态数据与自然环境(in-the-wild)数据库,以促进FER技术的临床实施,从而改善医患双方的诊疗服务并降低患者的死亡率和致残率。
本综述旨在系统评价面部表情识别(FER)技术在卒中诊断与康复中的应用现状。研究通过检索PubMed、Web of Science、CNKI及WanFang数据库,纳入9篇符合标准的研究,从辅助诊断与康复监测两个维度展开分析。
**1 引言**
本部分阐述了卒中的全球疾病负担,指出其年均导致约650万人死亡,预计2030年将升至约800万。早期诊断与干预对降低发病率和死亡率至关重要,而现有诊断方法如辛辛那提院前卒中量表(Cincinnati Pre-hospital Stroke Scale)、面部手臂言语测试(Face Arm Speech Test)及急诊室卒中识别量表(ROSIER)虽具有一定灵敏度(83%~91%),但 特异度有限。面部不对称作为卒中的重要早期临床表现,其及时识别对早期诊断意义重大,但医疗延迟、漏诊和误诊等问题仍阻碍着及时救治。FER技术通过面部肌肉运动、眼部行为及眉毛动作传递情感与情绪状态,已在抑郁症诊断、自闭症谱系障碍识别等领域广泛应用。卒中后患者面神经功能受损,表现为单侧面部麻痹、口角下垂及鼻唇沟消失等特征性改变,使FER技术成为早期卒中检测的有前景工具。此外,FER在卒中康复中也显示出潜力,可提供毫米级面部肌肉对称性测量,实现数据驱动的康复方案调整。
**2 方法**
**2.1 检索策略**
研究人员系统检索了中英文电子数据库(PubMed、Web of Science、CNKI和WanFang),检索时间从建库至2025年1月。检索式采用主题词组合:(TS = (facial expression OR facial recognition OR emotion recognition)) AND TS = (stroke OR cerebrovascular accident OR apoplexy OR brain vascular accident OR vascular accident brain OR cerebral hemorrhage OR cerebral infarction OR post-stroke OR cerebral ischemia OR hemorrhage stroke OR ischemic stroke OR acute ishemic stroke OR cerebrovascular disorders)。检索策略由具有系统评价经验的团队设计,经筛选后由一名研究者手工检索纳入研究的参考文献以补充相关文献,第二名研究者审核确认。
具体研究包括:Ou等(2025,中国)采用私有数据集进行横断面研究,253例参与者,AUC为0.882,准确率82.6%;Oliveira等(2024,巴西)基于多伦多神经面数据库(TNF)的病例对照研究,168个视频,准确率82%;Razlan等(2024,马来西亚)利用UTK Face Cropped数据集和面部下垂与面瘫数据集进行回顾性研究,2,000张图像,准确率92.67%;Phienphanich等(2023,泰国)基于FaceGAN和私有数据集,63例参与者及28,800张图像,AUC达0.91;Kaewmahanin等(2022,泰国)使用TNF数据集,496张图像,准确率97.89%;Parra-Dominguez等(2021,墨西哥)整合TNF和麻省眼耳医院数据库(MEEI),1,516张图像,准确率97.22%;Bandini等(2018,加拿大)私有数据集病例对照研究,23例参与者,准确率87%;Schimmel等(2011,瑞士)私有数据集病例对照研究,27例参与者,开发3D系统评估面部肌肉功能;Fan等(2022,中国)采用FER+、真实世界情感面孔数据库(RAF-DB)及私有数据集,42例参与者及36,500张图像,准确率99.81%。
Oliveira等选取TNF数据集中七项任务的动态视频,采用Python面部表隋分析工具箱(Py-Feat)识别和量化面部肌肉运动,发现KISS和SPREAD任务区分卒中患者与健康对照的准确率达82%,其余任务低于77%,提示下面部区域较上面部更适合卒中患者识别。Kaewmahanin等同样分析TNF数据,采用余弦相似度衡量高维空间中的向量相似性,在六项非言语任务(KISS、OPEN、SPREAD、BROW、BIGSMILE和BLOW)的动作峰值帧提取图像,识别29个面部关键点,计算各点与鼻部参考点向量并通过翻转左侧向量实现不对称分析,总体准确率达97.89%,子任务准确率98.2%~99.57%,发现下唇和眉毛是准确识别的主要视觉焦点。Parra-Dominguez等结合TNF和MEEI数据库(含10名健康者和50名麻痹患者),聚焦51个关键面部点,通过倾斜校正后计算关键点间距离量化面部不对称,对MEEI数据库卒中患者平均准确率94.06%,TNF数据集达97.22%,其分类模型可识别任何卒中患者面部表情,避免因无法执行指定动作导致的误诊。Razlan等利用Kaggle中UTK Face Cropped数据集和面部下垂与面瘫数据集,采用InceptionResNetV2处理图像,区分正常与麻痹面部表情的准确率达92.7%,支持实时网络摄像头和静态图像的连续监测。