数据库资源概览
癫痫预测研究高度依赖高质量的脑电图数据库。当前公开数据库主要分为头皮脑电图(sEEG)和颅内脑电图(iEEG)两类。sEEG以CHB-MIT数据库为代表,包含22名儿科患者的256Hz采样信号,具有非侵入性优势但信噪比较低;iEEG以Freiburg医院数据库为例,提供21名患者的高质量信号但需手术植入电极。新兴数据库如Epilepsy-ecosystem则整合了多中心长期监测数据,并引入穿戴式设备记录多元生理信号。值得注意的是,Bonn数据集同时包含健康人群与患者的sEEG/iEEG对照数据,为机制研究提供独特资源。数据库的差异直接影响模型泛化能力,例如在CHB-MIT上表现优异的模型,在异质性更高的AES数据集上可能出现性能衰减。
监督学习模型的创新路径
卷积神经网络通过局部感知特性高效提取EEG时空特征。早期研究采用二维卷积处理时频图(如STFT/CWT变换后的频谱图),而端到端一维卷积能直接处理原始信号,降低计算复杂度。三维卷积则进一步引入通道间关联建模,如Qi等人构建的3D-2D混合网络通过三维特征图像捕捉多通道协同模式。
循环神经网络及其变体(LSTM/Bi-LSTM)擅长刻画发作前的时序动态。例如Truong等人将DenseNet与LSTM结合,先通过卷积层提取空间特征,再利用LSTM解码时间依赖关系。注意力机制与Transformer的引入解决了长程依赖建模问题,如Wang等人设计的时空图注意力网络(STGAT)通过相位锁定值构建功能连接图,结合门控循环单元(GRU)实现动态拓扑学习。
图神经网络将大脑建模为动态网络,突破传统网格结构限制。Lian等人提出的JGRN网络能自适应学习患者特异性脑功能连接图,而Dissanayake则通过几何深度学习实现跨患者泛化。这类方法对解释癫痫网络传播机制具有生理学意义。
无监督学习的前沿探索
生成对抗网络通过生成器-判别器博弈增强数据多样性。Rasheed等人利用DCGAN生成频谱图扩充训练集,Xu则比较了多种GAN变体,发现深度卷积WassersteinGAN(DCWGAN)生成的预发作信号最接近真实分布。自编码器则专注于特征压缩与重构,Abdelhameed将二维卷积自编码器与双向LSTM结合,先无监督学习紧凑表示,再监督微调分类器。
自监督学习通过构造代理任务减少标注依赖。Yang团队利用时间序列自相关性生成弱标签,Zhao则通过加法网络与对比学习(AddNet-SCL)降低计算开销。这类方法在数据稀缺场景下展现潜力,如Epilepsy-ecosystem数据集中,自监督模型仅用未标注数据即实现89.1%的敏感度。
临床转化挑战与展望
模型泛化性受限于数据异质性与评估规范。当前研究普遍存在数据泄露风险,如同一患者数据同时出现在训练/测试集。建议采用留一患者交叉验证(LOPOCV)等严格协议,并在多中心数据上验证性能。
轻量化部署需求推动算法革新。脉冲神经网络(SNN)采用脉冲计算降低能耗,适合植入式设备;知识蒸馏技术可将复杂模型压缩为微型网络,如EfficientNet-B0在移动端的应用。可解释性方面,视觉Transformer(ViT)的注意力图谱能标识关键脑区,但需与临床特征(如伽马节律异常)建立可解释关联。
未来方向包括:构建跨医院联合学习框架以保护数据隐私;发展多模态融合模型(如EEG+fNIRS);通过元学习实现少量样本快速适配新患者。最终目标是建立具备临床级鲁棒性、可解释性且符合伦理规范的癫痫预测系统。