这篇论文提出了一种用于脑电(EEG)信号解码的双分支卷积 Transformer 网络 DBConformer,核心是通过并行结构更高效地捕捉 EEG 信号的时序和空间特征,实现了更精准、鲁棒且可解释的脑电解码。
核心内容
-
背景与动机
- 传统的 EEG 解码模型(如 CNN、CNN-Transformer 混合模型)多为串行结构,在捕捉长时序依赖和全局空间关系时存在局限,且容易过拟合。
- 现有的模型对空间通道信息的利用不足,难以同时高效建模 EEG 的时序动态和空间模式。
-
核心创新:DBConformer 双分支架构
- T-Conformer(时序分支):通过深度可分离卷积和 Transformer 编码器,提取 EEG 信号的精细时序动态和长程依赖。
- S-Conformer(空间分支):通过通道卷积和注意力机制,捕捉通道间的空间交互,并利用一个轻量级的通道注意力模块自适应增强关键通道的特征。
- 特征融合与分类:将两个分支的输出在特征维度上拼接,送入多层感知机(MLP)完成最终分类。
-
关键贡献
- 并行双分支设计:首次将时序和空间特征的提取并行化,避免了串行结构的信息瓶颈,提升了特征表达能力。
- 轻量级通道注意力:自适应学习不同 EEG 通道的重要性,提升了模型的可解释性和分类准确率。
- 高效性与泛化性:参数量仅为高性能 EEG Conformer 的 1/8,却在多种 EEG 解码任务中表现更优,具有更强的跨被试、跨数据集泛化能力。
- 生理可解释性:通道注意力模块的权重与神经生理学知识高度吻合,能定位到与运动想象等任务相关的关键脑区通道。
-
实验验证
- 在运动想象(MI) 、癫痫发作检测、 稳态视觉诱发电位(SSVEP) 三大 EEG 解码任务上进行了全面测试。
- 对比了 13 种主流基线模型(如 EEGNet、EEG Conformer 等),结果显示 DBConformer 在准确率、AUC、F1 分数等指标上均显著领先,且在跨被试、跨数据集场景下鲁棒性更强。
- 消融实验和可视化分析验证了双分支结构、位置编码和通道注意力模块的有效性。