一、核心定位与研究背景
1. 研究领域
本文聚焦基于脑电图(EEG)的脑机接口(BCI)解码任务。BCI 通过将大脑神经活动转化为外部设备控制指令,在残障人士辅助、医疗监测等场景具有重要应用价值。
2. 核心问题
EEG 信号存在低信噪比、非平稳性、跨被试差异性大等固有缺陷,传统解码模型面临三大挑战:
- 卷积神经网络(CNNs)擅长捕捉局部时空特征,但 receptive field 有限,难以建模长时程时间依赖和全局通道间关系;
- 现有 CNN-Transformer 混合模型(Conformer)多采用串行结构,导致局部与全局特征融合不充分;
- 多数模型忽视显式通道级建模,且高容量模型存在参数冗余、易过拟合问题。
解释:这三个是 EEG 信号的核心固有特性,也是解码模型面临的主要挑战
1. 低信噪比(Low Signal-to-Noise Ratio, SNR)(噪声)
- 核心含义:EEG 信号中 "有用的神经活动信号" 被大量 "无用的噪声" 淹没,信号和噪声的强度比值很低。
- 具体场景:EEG 记录的是大脑皮层的微弱电活动(微伏级),但同时会混入头皮肌肉收缩、眼动、呼吸、设备干扰、环境电磁噪声等无关信号,这些噪声的强度往往和有用信号相当甚至更高。
- 对解码的影响:模型难以区分哪些是真正反映运动想象、癫痫发作等任务的神经信号,哪些是干扰噪声,容易导致误判。
2. 非平稳性(Non-stationarity)(时间)
- 核心含义:EEG 信号的统计特性(如均值、方差、频率分布)会随时间变化,不会保持稳定。
- 具体场景:同一个人在不同时间(如上午 vs 下午)、不同状态(如疲劳 vs 清醒)下,执行相同运动想象任务时的 EEG 信号模式可能差异很大;甚至同一任务的不同试次之间,信号特征也会波动。
- 对解码的影响:基于某一时间段数据训练的模型,可能无法适配另一时间段的信号,导致泛化能力下降。
3. 跨被试差异性大(Significant Inter-subject Variability)(个体间)
- 核心含义:不同人的 EEG 信号存在显著个体差异,没有统一的 "标准模式"。
- 具体场景:不同被试的大脑结构、头皮厚度、电极佩戴位置细微差异,都会导致相同任务下的 EEG 信号在波形、幅度、频率分布上差异明显。比如 A 被试运动想象时 C3 通道信号强,B 被试可能是 Cz 通道信号强。
- 对解码的影响:为 A 被试训练的模型,直接用到 B 被试身上时性能会大幅下降,需要模型具备适应个体差异的能力。
3. 研究目标
针对运动想象(MI)分类、癫痫发作检测、稳态视觉诱发电位(SSVEP)识别三大核心任务,提出一种兼顾性能、效率与可解释性的 EEG 解码模型,解决现有模型在特征融合、通道建模、参数效率上的不足。
二、模型设计:DBConformer 核心创新
1. 整体架构
- 输入:批次 × 通道 × 时间的 EEG 预处理张量,仅需统一维度即可适配不同数据集,无需针对任务定制;
- 中间:双分支输出批次 × 嵌入维度的时空特征,实现特征分离提取与互补融合;
- 输出:批次 × 类别数的概率分布,直接给出每个试次的类别预测结果,可直接用于性能评估。(如运动想象0 = 左手想象,1 = 右手想象;癫痫:0正常,1发作;SSVEP:12类别)
DBConformer 采用双分支并行结构,对称建模 EEG 信号的时间动态与空间模式,核心由 temporal Conformer(T-Conformer)、spatial Conformer(S-Conformer)、通道注意力模块及特征融合层组成,架构对比见下表:
| 模型类型 | 结构特点 | 核心局限 |
|---|---|---|
| 传统 CNN(如 EEGNet) | 单分支串行,局部特征提取 | 缺乏全局依赖建模 |
| 串行 Conformer(如 EEG Conformer) | CNN+Transformer 串行堆叠 | 局部 - 全局特征交互不足,空间信息易丢失 |
| DBConformer(本文) | 时间 - 空间双分支并行 | 兼顾局部 / 全局特征,显式通道建模 |

2. 关键模块详解
(1)数据预处理:欧氏对齐(EA)
- 目的:缓解跨被试数据分布差异,公式如下:
其中R为被试所有试次协方差矩阵的均值,
实现数据分布标准化。
(2)T-Conformer:时间分支
- 核心功能:捕捉长时程时间依赖与局部谱时特征
- 流程:
- 时间补丁嵌入:通过深度可分离 1D 卷积 + 批归一化 + GELU 激活,提取局部时间特征;
- 平均池化:下采样生成非重叠时间补丁,降低计算量;
- 时间 Transformer 编码器:添加可学习位置编码,通过多头自注意力建模补丁间长时依赖;
- 均值池化:聚合补丁特征,输出全局时间表征。
解释:
局部谱时特征:是EEG 信号在 "局部时间窗口" 内同时包含的 "频谱特征" (比如 EEG 的 α 波、β 波等振荡节律,不同任务对应不同频率的活动)和 "时间特征"(比如该时间窗口内信号的幅度变化、波形形态)可用来区分不同任务(比如运动想象 vs 静息)。
深度可分离 1D 卷积:把 "普通卷积" 拆成两步,在减少参数的同时保留局部特征提取能力。
- 深度卷积 :对每个通道单独做 1D 卷积(比如每个通道用一个形状为1×K的卷积核),只捕捉单个通道内的局部时间特征,参数少;
- 逐点卷积:用1×1的卷积核(形状是Cin×Cout),融合所有通道的特征,同时调整输出通道数。
(3)S-Conformer:空间分支
- 核心功能:建模通道间交互关系,强化空间显著性
- 流程:
- 空间补丁嵌入:逐通道时间滤波 + 时间维度平均池化,压缩每个通道的时间响应;
- 空间 Transformer 编码器:添加通道维度位置编码,捕捉全局通道依赖;
- 轻量化通道注意力模块:
- 通过两层全连接网络生成通道权重:
对第i个样本的第c个通道特征zic,通过 "线性变换 + 非线性激活 + 线性投影",计算出该通道的 "原始重要性分数"kic。 - Softmax 归一化权重:

- 加权求和得到空间表征,自适应强调关键通道(如运动皮层相关通道)。
- 通过两层全连接网络生成通道权重:

(4)特征融合与分类
- 拼接时间与空间表征:

- 分类器:3 层 MLP(含 ELU 激活与 Dropout 正则化),输出类别概率。
3. 创新点总结
- 双分支并行设计:首次将时间与空间特征建模解耦为并行分支,是时空信息独立处理的认知机制;
- 显式通道注意力:数据驱动的通道权重分配,无需额外监督,提升分类精度与可解释性;
- 参数高效性:通过轻量化 Transformer 与分支共享机制,参数数量较 EEG Conformer 减少 ;
三、实验设计与结果
1. 实验设置
(1)数据集
覆盖三大任务的 9 个公开数据集,关键信息如下:
| 任务类型 | 数据集 | 被试数 | 通道数 | 采样率 (Hz) | 核心特点 |
|---|---|---|---|---|---|
| 运动想象 | BNCI2014001 等 6 个 | 4-54 | 3-62 | 250-1000 | 含不同通道数(电极)、任务类型(手 / 脚运动) |
| 癫痫检测 | CHSZ、NICU | 27/39 | 19 | 256-1000 | 临床数据,类别不平衡(比如 1000 个数据片段里,可能只有 50 个是发作信号,950 个是正常信号。) |
| SSVEP | Nakanishi2015 | 10 | 8 | 256 | 12 类视觉刺激,短试次(1s)(实验中给被试呈现 12 种不同频率的闪烁视觉刺激,模型需要从 EEG 信号中区分出被试注视的是哪一种(12 选 1),分类难度高;模型需要基于这 1 秒的短信号完成解码) |
(2)基线模型
对比 13 种主流模型,包括:
- CNN 类:EEGNet、SCNN、FBCNet 等;(纯卷积神经网络,无 Transformer/Mamba 等模块,依赖卷积核捕捉 EEG 的局部时空特征。)
- CNN-Transformer 类:EEG Conformer、CTNet、MSCFormer 等;
- CNN-Mamba 类:SlimSeiz 等;
- 任务专用模型:EEGWaveNet(癫痫检测)。
(3)评估场景与指标
- 场景:时序划分(CO)、5 折交叉验证(CV)、留一被试交叉验证(LOSO)、跨数据集(CD),覆盖被试内、跨被试、跨设备场景;
- 指标:准确率(MI/SSVEP)、AUC/F1 / 平衡准确率(癫痫检测,应对类别不平衡)。

解释:
1. CO(时序划分,Chronological Order)
- 核心逻辑 :把同一个被试的 EEG 数据按时间先后顺序切分------ 比如前 80% 是 "早一点采集的试次"(训练集),后 20% 是 "晚一点采集的试次"(测试集)。
- 模拟场景:"同被试、不同时间" 的解码 ------ 比如用户上午用 设备训练模型,下午用同一个模型控制设备,此时信号会因疲劳、状态变化出现 "非平稳性"。
- 评估目标:验证模型能否适应 "同一个体的信号随时间波动"。
2. CV(5 折交叉验证,Cross Validation)
- 核心逻辑 :把同一个被试的所有试次随机打乱后分成 5 份,每次用 4 份训练、1 份测试,重复 5 次后取平均准确率。
- 模拟场景:"同被试、同一时间段内" 的解码 ------ 比如用户在一次实验中连续完成多个试次,模型用部分试次训练、另一部分试次测试。
- 评估目标:验证模型在 "被试内、信号相对稳定" 场景下的基础解码能力(是模型性能的 "基准线")。
3. LOSO(留一被试交叉验证,Leave-One-Subject-Out)
- 核心逻辑 :把所有被试的数据分开,每次留 1 个被试的所有试次做测试集,用剩下所有被试的试次做训练集,遍历所有被试后取平均准确率。
- 模拟场景:"跨被试" 的解码 ------ 比如用 A、B、C 被试的数据训练模型,直接给新被试 D 用,这是 BCI 落地的核心难点(因为不同被试的 EEG 差异大)。
- 评估目标:验证模型能否适应 "不同个体的信号差异"(对抗 EEG 的跨被试差异性),是衡量模型泛化能力的 "黄金标准"。
2. 核心结果
(1)性能优势
- MI 分类:在 6 个数据集 3 种场景下,平均准确率达 79.37%(CO)、82.32%(CV)、76.67%(LOSO),显著优于所有基线(p<0.05);
- 癫痫检测:CHSZ 数据集 AUC 达 91.75%,NICU 数据集平衡准确率 65.21%,较 EEG Conformer 提升 2-4%;
- SSVEP 识别:平均准确率 87.59%,远超第二名 IFNet(79.44%)。
(2)参数与效率
- 参数规模:仅 9.2k 参数,较 EEG Conformer(789.7k)减少 85 倍;
- 推理速度:单批次仅需 8.7ms,满足 BCI 实时性要求(<10ms)。
(3)可解释性验证
- 时间注意力:聚焦局部相邻时间窗口,同时捕捉长时依赖;
- 空间注意力:运动皮层通道(C3(左侧运动皮层)、Cz(中央运动皮层)、C4(右侧运动皮层))权重最高,与神经生理常识一致;
- t-SNE 可视化:双分支特征聚类更紧凑、类间分离度更高,验证时空特征互补性。
(4)消融实验

| 消融组件 | 性能下降幅度(MI 平均准确率) | 结论 |
|---|---|---|
| 空间分支(仅 T-Conformer) | 3.2-5.7% | 空间特征对解码至关重要 |
| 位置编码 | 2.1-3.4% | 时间 / 通道顺序信息提升建模精度 |
| 通道注意力 | 1.8-2.9% | 自适应通道加权增强空间表征 |
四、总结
DBConformer 通过双分支并行架构、显式通道注意力机制,实现了 EEG 解码中局部 - 全局特征、时间 - 空间模式的高效融合。其核心贡献在于:
- 突破传统串行 Conformer 的结构局限,提出符合神经生理机制的并行建模方案;
- 在保证 SOTA 性能的同时,大幅降低模型复杂度,解决小样本 EEG 数据的过拟合问题;
- 兼顾性能与可解释性,为临床落地提供可靠的技术支撑。
该模型不仅适用于 MI、癫痫检测、SSVEP 三大核心任务,其设计思路也可为其他时序信号(如 ECG、肌电信号)的解码提供参考。