在当今科技飞速发展的时代,脑机接口(Brain-Computer Interface,BCI)技术宛如一颗璀璨的新星,备受瞩目。它致力于将人类大脑的神经活动转化为可操作的指令或信息,在神经康复、神经形态设备以及人工智能等众多领域都有着巨大的应用潜力。然而,这一技术的发展却面临着诸多挑战,其中脑电图(Electroencephalography,EEG)信号受眼部活动干扰的问题尤为突出。
EEG 以其非侵入性、易获取性和高时间分辨率的优势,成为实时捕捉大脑电活动、研究神经动力学的关键手段。但它存在一个明显的弊端,即会无差别地整合大脑内部所有来源的信号,这使得它极易受到各种干扰,特别是眼部活动产生的伪影,像眨眼和眼球运动等。眨眼在人类生活中十分常见,平均每分钟约 20 次,每次持续约 0.2±0.026 秒。在 BCI 研究里,眨眼既是潜在的控制指令,可用于人机交互;但同时,它也是恼人的噪声,会干扰 EEG 信号,使神经信号被掩盖超 0.3 秒,约占一分钟时长的 10%,严重影响了对用户认知状态和意图的解码效率与准确性。
不仅如此,当前已有的 EEG BCI 数据集也存在不少问题。许多数据集要么仅聚焦于眨眼记录,电极覆盖范围有限,要么只针对特定的 BCI 范式,难以全面深入地探究眨眼的特征。而且,这些数据集普遍样本量较小、试验次数少,容易出现过拟合现象,大大降低了 BCI 研究的可靠性和可重复性。在这样的背景下,为了突破这些困境,上海交通大学的研究人员展开了一项极具意义的研究。
研究人员精心构建了一个大型的多模态数据集,涵盖了 EEG 信号、眼动追踪数据、高速摄像头记录,以及受试者的心理状态和特征等丰富信息。该数据集涉及 31 名参与者,包含 63 个实验 session,其中运动想象(Motor Imagery,MI)、运动执行(Motor Execution,ME)、稳态视觉诱发电位(Steady-State Visual Evoked Potentials,SSVEP)这三种范式各有 2520 个实例,P300 视觉诱发电位则有 5670 个实例。为了确保实验数据的质量和可靠性,研究人员在实验设计、样本采集等方面做了充分的准备。
在实验设计阶段,研究人员通过先验样本量估计,依据研究目的和不同信号的特点,精确计算出所需的样本量。例如,考虑到眨眼电位与其他 EEG 数据的差异,以及不同范式下信号的特征,确定了至少需要 63 个 session 的记录,约 46 小时的数据量。参与者均为健康志愿者,他们在实验前签署了书面同意书,确保数据使用的合法性和匿名性。实验过程中,参与者需完成 MI、ME、SSVEP 和 P300 这四项 BCI 任务,每个任务时长控制在一定范围内,以平衡数据采集和用户疲劳问题。
数据采集时,研究人员使用了多种先进设备。EEG 信号通过 65 通道 Quik-cap 与 SynAmps2 系统相连的放大器采集,电极按扩展 10/20 系统放置;眼动追踪数据由 Tobii TX300 眼动仪以 300Hz 的采样率获取;高速摄像头(Phantom Miro M310)则以 150fps 的帧率记录单眼情况。为了保证数据的同步性,研究人员借助 E-Prime 软件生成提示信号,利用 Tobii TX300 的内部时钟作为时间参考,通过 Arduino Nano 和 Cedrus StimTracker 等设备实现了多设备间的精确同步。
研究结果方面,在眨眼分析中,研究人员发现眨眼具有显著的个体间和个体内差异。通过视频图像分析,利用计算机视觉技术提取关键眼部区域的子图像,准确检测眨眼并确定其起止时间。同时,从 EEG 信号中也能检测到眨眼,对比 EEG 和高速视频记录,验证了数据的质量。例如,不同峰值振幅的眨眼在 EEG 和视频中的表现具有一致性,且 EEG 的额极通道、眼电图(Electrooculogram,EOG)电极和肌电图(Electromyogram,EMG)传感器记录的模式与视频中的眼睑运动数据相符。
在信号质量评估上,研究人员计算了信号噪声比(Signal-to-Noise Ratio,SNR)。对 EEG 数据进行处理后,绘制 SNR 图展示电极的时间平均情况,并进行源定位分析。同时,分析了运动执行和运动想象任务中的事件相关去同步 / 同步(Event-Related Desynchronization/Synchronization,ERD/ERS),以及 P300 范式中的事件相关电位(Event-Related Potentials,ERP)和稳态视觉诱发电位,这些分析都表明了数据集的可靠性和完整性。
在分类准确性方面,对于两类运动想象范式,研究人员采用的 ABCD 方法达到了 94% 的分类准确率,这充分证明了数据集的高质量以及在 BCI 应用中的适用性。
综合来看,这项研究意义重大。该多模态数据集为研究人员提供了丰富且高质量的数据资源,有助于开发更有效的信号处理算法,减少眼动相关伪影的影响,提高任务特定神经解码的准确性。同时,它还能用于评估 BCI 技术在不同范式下的适应性,推动对认知过程和行为的深入理解。发表在《Scientific Data》上的这一研究成果,为 BCI 领域的发展开辟了新的道路,为后续研究提供了重要的参考和支持,有望促进 BCI 技术在更多领域的广泛应用和进一步发展。