在安全关键环境中,驾驶员疲劳可能导致致命后果。仅在美国,每年就有大约328,000起事故归因于疲劳驾驶,造成约109,000人受伤和6,400人死亡(Tefft, 2012)。驾驶疲劳被定义为一种意识受损的状态,驾驶员更倾向于入睡而不是保持清醒(Slater, 2008)。这种状态会导致反应时间变慢、决策能力下降以及整体反应能力减弱(Ashraf等人,2019;Khushaba等人,2010)。随着技术的进步,已经开发出使用图像、生理信号和车辆传感器来检测疲劳的数据驱动方法(Saleem等人,2023;Wang等人,2024e)。然而,并非所有测量方法都适合在车辆中部署,特别是在具有驾驶自动化的车辆中,因为驾驶员不再需要持续控制车辆,这使得基于车辆的测量方法变得不那么相关。此外,相关的隐私问题也可能降低基于图像的疲劳检测的接受度。因此,由于与车内摄像头相比,生理信号的收集相对不那么私密,通过生理信号监测疲劳受到了研究人员越来越多的关注(Kakhi等人,2024)。
传统的基于生理信号的驾驶员疲劳监测模型主要依赖于从心电图(ECG)信号中手动提取生理特征,如低频(LF)和心率(HR)。这些模型通常使用机器学习(ML)技术,包括LightGBM和SVM(Cheon和Kang,2017;Chowdhury等人,2018;Zhou等人,2022)。虽然过去的研究取得了令人满意的准确率,但这些低级特征的手动提取过程可能计算密集,并可能导致原始信号中包含的信息丢失。随着深度学习(DL)的发展,越来越多的工作尝试基于原始生理信号开发高级DL模型,而无需手工制作特征来监测疲劳(Hultman等人,2021;Fan等人,2021;Alguindigue等人,2024)。与传统方法相比,基于DL的方法消除了耗时的手动特征选择需求,并提供了端到端的自动化解决方案。此外,DL方法在具有多样化人群的复杂环境中表现出更强的鲁棒性(Zhang等人,2022)。
尽管DL方法在检测驾驶员疲劳方面显示出有希望的结果,但它们在现实世界情境中的有效性仍然有限(如图1所示)(Wang等人,2025a)。许多先前的检测方法(Cheon和Kang,2017;Hultman等人,2021)是在数据集内部协议上训练和测试的,这意味着所有数据都来自一个特定的实验,其中疲劳是通过特定程序诱导的,并通过特定标准进行评估的。这种数据集内部协议不能保证模型在新环境中的泛化能力(Kim等人,2025)。例如,在现实生活中,各种疲劳诱因,如低唤醒度、精神疲劳和睡眠剥夺(Ayas等人,2024a),可能导致不同的生理反应。此外,不同研究中疲劳的评估方法也存在差异。采用了几种驾驶员疲劳评估标准(Kundinger等人,2020a),包括:(1)主观评估,依赖于自我评估问卷,如Karolinska疲劳量表(KSS)(Kaida等人,2006),这得到了欧盟的认可(Ahlström和Anund,2024);以及(2)客观指标,如眨眼和点头,这些在中国被采用(Bao和Xu,2024)。此外,个体差异和收集设备的不同也可能引入异质性。这些异质性也可以描述为不同数据集之间的领域差异,给实现可泛化的疲劳监测带来了挑战(Wang等人,2025a)。为了验证这一点,我们进行了跨数据集评估。如表3所示,当在未见数据集上测试时,没有任何方法表现良好。
最近的研究试图通过联合训练模型并在多个数据集上使用领域泛化(DG)技术来解决这个问题(Kim等人,2025;Ballas和Diou,2024)。然而,现有的疲劳检测DG方法通常以脑电图(EEG)作为输入。与EEG相比,心电图(ECG)、皮肤电活动(EDA)和呼吸(RESP)实际上更适合用于驾驶员疲劳检测,因为它们不太容易集成到车辆舱内,同时可以保持与疲劳状态的强生理相关性(Freitas等人,2024;Gottlieb等人,1999;Saleem等人,2023)。据我们所知,还没有提出以ECG、EDA和RESP作为输入的通用方法。
受到上述差距的启发,本研究试图回答三个问题。(1)在异质性诱因、传感器和评估标准下,生理信号中哪些信息是必要且足够的,以支持驾驶员疲劳检测的泛化?(2)我们如何从原始的多模态生理信号(ECG、EDA和呼吸)中学习与状态相关的表示,同时保持这些表示在不同领域之间的一致性,并保留清醒和疲劳状态之间的区分能力?(3)如何使学习过程对由主观自我报告引起的标签模糊性和噪声具有鲁棒性,以便模型不会陷入特定领域的偏见,而是捕捉可转移到新环境中的基于生理学的语义?
为了回答这些问题,我们提出了一种新的驾驶员疲劳检测方法,称为DrowsyDG-Phys,该方法结合了领域泛化(DG)的原理。我们设计了一个骨干网络,自动学习来自时域和频域的输入信号的信息表示。该模型在多个源领域(即在部署前已知的数据集)上进行了训练,并在目标领域(即模拟部署环境的未知数据集)上进行了测试。然后,受到生理学先验知识的启发(Sun和Li,2024),我们引入了一种基于对比学习的正则化来增强模型对未见领域中异常样本的鲁棒性。此外,为了解决领域差异带来的挑战,我们提出了另一种正则化损失,该损失将具有相同标签但在不同领域的样本的特征空间中心化,并扩大了疲劳和清醒之间的区分平面。为了公平评估我们提出方法在多源领域中的性能,我们使用了包含三种类型疲劳诱因和两种评估标准的三组数据集。此外,我们还创建了一个自收集的数据集,该数据集专注于SAE Level-3条件下的疲劳驾驶,在该数据集中,60名参与者通过操纵驾驶模拟器中的舱内环境被诱导进入疲劳状态。通过广泛的实验,我们提出的方法DrowsyDG-Phys优于比较基线,并提高了驾驶员疲劳分类的泛化性能。