脑机接口(BCIs)是基于计算机的系统,它们直接从大脑接收信号,并将指令传递给计算机或其他外部设备(Wolpaw等人,2002年)。BCIs通常应用于脑电图(EEG)中,受试者执行特定任务。例如,运动想象指的是在没有明显肌肉运动的情况下在心中复现一个动作,这在神经康复(Irimia等人,2018年)和体育训练(Guillot和Collet,2008年)中得到了广泛应用。
已经从EEG信号中提取了预定义的特征,包括时间域的特征(例如P300(Allison和Pineda,2003年)、N400(van Vliet等人,2010年)和错误相关电位(Buttfield等人,2006年)),以及频率域的特征(例如功率谱密度和时间-频率能量分布(Herman等人,2008年))。Zhang等人(2017年)在将EEG信号输入卷积神经网络(CNN)进行分类之前,首先应用了短时傅里叶变换(STFT)。常用的空间模式(CSP)方法广泛用于BCI运动想象任务(Ang等人,2008年,Ang等人,2012年);然而,其对伪迹的高敏感性促使人们开发了自适应空间滤波器,以排除感兴趣区域(ROI)之外的脑活动(Grosse-Wentrup等人,2006年)。
研究人员最近开始使用端到端深度学习(DL)模型来实现BCI分类任务,而无需手动特征提取(Schirrmeister等人,2017年)。Sakhavi等人(2018年)提出了一个基于CNN的DL框架,该框架能够从EEG信号中学习时间特征。Manor和Geva(2015年)证明CNN可以用于检测参与者在连续暴露于图像时的脑活动中的视觉模式。Lawhern等人(2018年)开发了一个紧凑的CNN用于EEG分析(EEGNet),在多种BCI范式下表现良好。Santamaria-Santamaria-Vazquez等人(2020年)提出了一种结合了EEGNet和inception模块的新网络架构,并获得了比EEGNet更显著的改进。Salami等人(2022年)提出了一种称为EEG-ITNet的端到端深度学习架构,通过将inception模块和因果卷积与膨胀结合到EEGNet中。Kalafatovich等人(2020年)将注意力驱动的CNN应用于视觉对象识别任务。他们证明,在枕叶区域添加掩码可以帮助模型专注于与视觉处理相关的信息。这些结果表明,通过仅处理与目标任务最相关的脑活动,可以提高BCI的性能。虽然注意力机制和Transformer架构(Vaswani等人,2017年)在BCI深度学习中变得普遍(例如EEG-Conformer(Song等人,2022年)),但这些模型通常在传感器级别或特征级别内部应用注意力来加权时间步或通道。我们的工作通过引入一个增强框架来区分自己,该框架在分类之前直接在估计的皮层源空间中应用可训练的注意力层以实现信号增强。
使用特征表示来提高BCI性能受到EEG信号固有空间分辨率不足的限制。一种提高EEG信号质量的方法是关注大脑中EEG信号的来源(即源估计),使用MNE(Hämäläinen和Ilmoniemi,1994年)、dSPM(Dale等人,2000年)或sLORETA/eLORETA(Pascual-Marqui等人,2002年,Pascual-Marqui等人,2011年)。Pantazis和Adler(2021年)声称他们的DL框架用于MEG源估计问题,其性能优于流行的RAP-MUSIC定位算法(Mosher和Leahy,2002年)。然而,这些源定位方法不适合BCI有三个原因。首先,它们不是为特定任务设计或优化的。其次,重建源的高维度导致使用机器学习(ML)模型时训练数据过拟合。第三,实验过程中可能无法收集个性化信息,如源空间、边界元素模型和配准信息。
为了将我们的工作与现有的源级深度学习方法进行对比,我们注意到Borra等人(2023年)的相关研究,他们成功地将CNN应用于EEG源数据进行二分类任务(直立 vs. 倒置视觉刺激),这与我们的左手 vs. 右手运动想象分类目标类似。然而,一个关键的区别在于数据流程:Borra等人的研究不是完全端到端的,模型输入维度是通过提取每个ROI的活动的首个主成分得到的