目录
[EEG 维度降低](#EEG 维度降低)
前言
脑电信号(EEG)因其安全性、便携性、易用性、高时间分辨率和低成本等特点而被广泛使用。在脑机接口和临床应用中,EEG 信号是直接反映大脑活动的有用工具。例如,EEG-BCI系统的一个典型应用是通过大脑信号控制机器人手臂,这不仅对残疾人而且对普通人改善生活都有很大帮助。因此,处理和分析脑电图信号以适应脑机接口的多种应用非常重要。脑电信号处理通常涉及三个主要步骤:预处理、特征提取和分类。
脑电图信号通常使用放置在头皮上的多个电极来收集,电极放置在头皮的不同位置以收集来自不同大脑区域的信号。电极的定位或排列称为蒙太奇,蒙太奇有两大类:双极和参考。前者将电极与其相邻电极进行比较,并将它们的差异作为通道输出,而后者选择一个参考电极并将所有其他电极与该电极进行比较。采集后,原始 EEG 信号表示为形状为 C × T 的 2D 张量(多通道 1D 序列),其中 C 和 T 分别表示通道数和时间样本数。许多数据集采用参考蒙太奇,因此在这些数据集中,一个通道对应一个电极。收集到的信号可以被认为是许多脑细胞活动的复杂混合物,导致脑电图信号表现出各种节律,反映不同的认知状态并与不同的大脑活动相关。根据频率,不同的节律可大致分为几个频段,包括 delta (1--4 Hz)、theta (4--8 Hz)、alpha (8--12 Hz)、beta (13--25 Hz) 和 gamma (≥ 25 Hz)。此外,脑电图信号可以有不同的范式,指不同类型的任务或刺激。常见的范式包括 P300 、运动意象 (MI)、稳态视觉诱发电位 (SSVEP) 等。这些范式通常与特定的大脑活动和信号处理任务相关。例如,当一个人想象他/她的肢体移动时,脑电图信号会发生一些特定的变化,其范例称为MI,这将与控制设备移动的任务相关。
EEG特点
- 空间分辨率低,信噪比 (SNR) 低。脑电图信号容易受到干扰和伪影的影响。因此,信号处理必须解决从异常信号中分离噪声并提取有意义的特征的挑战。
- 维度灾难。脑电图信号在采集过程中具有多个通道,导致计算量随着维数的增加呈指数级增长。
- 非平稳性。脑电图信号的统计数据随着时间的推移而迅速变化。
- 缺乏大的标记训练样本。由于数据采集时对参与者注意力的要求较高,因此很难获得大量的大脑数据。例如,视觉诱发电位(VEP)信号采集过程中频繁的视觉刺激可能会导致视觉疲劳。因此,许多数据集的样本数量有限。
- 个体被试的差异性。脑电图信号在个体之间存在显着差异,导致稳定性和泛化性较差。在特定被试上训练的模型可能在新被试上表现不佳。
EEG预处理
基本的预处理方法是基于脑电信号的一些基本特征。这些方法包括过滤、电极定位、删除无用数据、基线校正、重参考、下采样、去除伪影、去除坏段等。EEGLAB 工具箱可以轻松调用这些方法,EEGLAB 工具箱是一个有用的 Matlab 工具箱,可以方便地调用各种方法。
EEG通道选择
采集过程中,每个电极都会记录一个数据通道。因此原始脑电信号有C个通道,这被称为脑电信号的多维性。不同的通道对应大脑的不同区域。对于特定任务,某些通道可能包含与任务无关或冗余的信息,这会增加数据大小和时间成本,并对 BCI 的性能产生负面影响。通道选择是一种选择任务相关区域中最显着的通道作为最优通道以提高性能和效率的方法。然而,多通道脑电图数据包含复杂的通道相关性,而不是简单的邻接关系。因此,我们应该根据通道的特征,如相关性、电极距离、任务特性等寻求选择标准,以选择最大程度保留信号特征的通道。
EEG数据增强
为了解决小数据集的问题,数据增强是一种有效的方法,它既包括滑动窗口、噪声注入、分割重组等非深度学习方法,也包括生成对抗网络和变分自编码等深度学习方法。许多模型,尤其是深度学习模型,需要大量的训练数据才能实现高分类精度并避免过度拟合。然而,由于脑电信号的固有特性,收集大量脑电数据是很困难的。数据增强可以从小数据集中生成新数据,提供足够的训练数据。
在非深度学习方法中,滑动窗口通过在信号上滑动窗口将信号裁剪成多个片段。段的长度和重叠取决于窗口大小和窗口步长。滑动窗口增加了训练数据的数量,但也消除了long-term信息。分割方法可以根据脑电信号的时间特征切出特定的时间间隔。
高斯噪声注入将高斯分布的随机矩阵注入到原始数据中,以实现数据增强。这些方法直观且简单,但由于增强后的相似性,可能会加剧模型的过度拟合。
GAN 及其变体可以通过训练生成网络和判别网络来生成人工数据。生成网络接受来自特定分布(例如高斯分布)的随机噪声,并尝试生成类似于真实数据的合成数据,而判别网络则经过训练以对真实数据和合成数据进行分类。这两个网络是对抗性的,经过充分的训练,生成网络将产生相似的信号。对于VAE,就像普通的自动编码器(下面将介绍)一样,编码器将原始数据转换为潜在数据,解码器将潜在数据映射回真实数据。为了生成新数据,VAE 从学习的潜在空间中随机采样点,然后将这些样本传递给解码器网络,解码器网络将它们重建为新样本。 GAN 和 VAE 都间接生成新样本。
EEG 维度降低
脑电图信号是多维信号。与传统的一维信号相比,脑电信号处理具有较高的计算复杂度。因此,我们通常需要根据脑电信号的结构施加相应的约束假设并降低维数,以进一步提高特征信号的提取效果和分类鲁棒性。
许多算法可以降低维度。例如,主成分分析(PCA)可以将脑电图信号分解为具有最大方差的线性不相关成分。在重建 EEG 信号之前,可以通过 PCA 分离出眼睛和肌肉的干扰等冗余成分。独立成分分析 (ICA) 根据数据特征将伪影与 EEG 信号分离为独立成分。有研究提出预处理可以通过ICA将复杂的混合信号分解为独立的信号,从而实现P300信号与噪声的分离。然而,由于ICA算法没有经过训练来学习噪声信号的特征,一些有价值的信号可能会作为噪声被去除,导致一些大脑活动信息丢失。利用小波变换(WT)提取脑电信号的特征,然后通过ICA-WT滤波,可以有效消除噪声伪影,从而有效提高不同受试者脑电信号的准确性。 目前有学者研究了用于预处理的自动编码器(AE),编码器将输入原始数据的信息提取到一个小的潜在空间中,然后解码潜在数据以重建数据集。由于潜在变量携带原始信号的信息但维度较少,因此我们可以使用潜在变量作为后续步骤的输入。
EEG特征提取
传统特征提取
传统特征提取中采用的传统算法包括公共空间模式(CSP)、傅立叶变换(FT)、功率谱密度(PSD)、小波变换(WT)、小波包分解(WPD)、经验模态分解(EMD)、自回归( AR)和 Hjorth 参数等
通用空间模式(CSP)是一种用于二元分类任务的空间域过滤算法。 CSP提取多通道EEG信号每一类的空间分布分量,并寻求最佳投影方向,以最大化一类的方差并最小化另一类的方差。 由于CSP最大化了脑电信号之间的差异,因此更有能力挖掘脑电信号的特征。 然而,由于脑电信号的多通道分析需要大量电极,电极数量需要进一步优化。 CSP 也有多种变体,如公共空间频谱模式(CSSP)、滤波器组 CSP(FBCSP)等。
脑电图信号表现出不同的频段,每个频段都与不同的大脑活动相关。 因此,在频域和时频域分析脑电信号是一种常见的方法。
傅里叶变换(FT),特别是快速傅里叶变换(FFT)作为快速版本,是频率分析的基本工具。 它可以将平稳信号变换到频域以提取频率特征。 功率谱密度 (PSD) 是信号自相关函数的 FT,揭示了不同频率上的功率(能量)分布。 然而,FT 和 PSD 只能分析整个系列的频率内容。 为了分析频率随时间的变化,需要时频分析方法。 短时傅里叶变换 (STFT) 将信号分割成短时间间隔,然后应用傅里叶变换来分析频率方差。 小波变换(WT)是STFT的改进方法,适用于分析脑电信号等非平稳信号。 小波包分解(WPD)是WT的改进,进一步分解高频子带并提供更好的频率分辨率。 经过时频分析后,信号形状变为 F × T × C,其中 F 表示频率分辨率。
此外,自回归(AR)是时间序列预测中常用的方法。 AR 假设时间序列的当前值与其过去值线性相关。
另一种用于分析非平稳脑电图信号的技术是经验模式分解(EMD)。 EMD 是一种非线性方法,可将信号分解为其固有的振荡模式。 该方法已用于研究脑电信号的时频特性。 最后,Hjorth 参数是用于提取有关 EEG 信号信息的统计特征。
Hjorth 的三个参数是活动性、移动性和复杂性。 活动性衡量信号的能量,移动性衡量其频率内容,复杂性反映信号的非线性。
深度学习自动提取特征
传统的特征提取算法(例如 CSP 和 PSD)存在局限性。 例如,特征提取和分类是分开进行的,在特征提取过程中需要手动添加大量经验或先验知识。 相比之下,深度学习算法利用由许多隐藏层组成的深层架构,使用大量训练参数和数据自动提取脑电信号的时空特征。 深度学习在空间检测中的判别模式的位置是无关的,这通常导致神经网络优于传统的机器学习算法。 深度学习算法能够学习捕获脑电图信号底层结构的有用特征,而无需显式特征提取。 此外,深度学习方法有潜力克服传统特征提取方法的局限性,使脑电信号分类更加准确。
机器学习的一般任务可以分为两类:回归和分类。 有几篇采用回归方法的新颖论文,采用深度学习来跟踪机器人手臂的运动。 但在脑电图的研究中,大多数研究都集中在分类上,因为任务的标签和处理的输出通常是分类变量。 开发更高性能和更鲁棒的分类算法是脑电图研究的重点。 分类算法的选择对于确定系统的性能起着至关重要的作用。
传统的BCI分类算法包括支持向量机(SVM)、线性判别分析(LDA)和k-近邻(KNN)。 SVM 可用于线性可分离数据,通过优化算法找到最佳超平面。 对于线性不可分的问题,可以使用核函数将数据变换到更高维的空间。 LDA 是一种简单的线性分类器,它将所有样本投影到一条线上,以最大化类间距离并最小化类内方差。 KNN是一种分类方法,统计与新样本距离最近的k个样本的类别数。 虽然 SVM 和 LDA 是具有良好性能的流行算法,但 SVM 计算复杂,而 LDA 需要线性可分离性。 KNN 简单易用,但泛化能力较弱。 1.3.2. 深度学习算法 深度学习算法已被证明可以有效地从高维数据中提取特征。 它们对于处理通常是高维且复杂的脑电图信号特别有用。 深度学习方法使用人工神经网络(ANN)来处理数据,它可以自动学习与任务相关的特征,并且可以很好地泛化不同的任务。 ANN 的结构如图 1 顶部所示。应用于 EEG 信号处理的常见深度学习算法和 ANN 包括多层感知器(MLP)、卷积神经网络(CNN)、循环神经网络(RNN),LSTM等
未来展望
创新的预处理方法
许多创新的预处理方法都与深度学习网络的结构有关。例如,Liu和Yang(2021)以及Bagchi和Bathula(2022)都将原始信号转换为3D张量,前者简单地表示矩阵中电极的位置,并对没有电极的细胞填充零,而后者则采用方位角等距投影(AEP,一种将地球仪投影到平面上的方法)将3D电极的分布转换为2D热图图像,并保持电极的相对距离。经过 AEP 和插值后,EEG 信号变成带有大量 2D 热力学图像的视频流,可以通过 ConvTransformer 进行分析。
跨被试性能问题
许多研究表明单个被试内任务的准确性很高,但跨被试任务的准确性较低。例如,在 一项研究中,当将迁移学习应用于其他受试者时,准确性从受试者内任务的 99% 急剧下降到约 50%,这表明参数过度拟合给定的个体,并且不能轻易地推广到新个体。这个问题给脑电图应用和脑机接口技术带来了瓶颈,目前尚未设计出适用于所有参与者的通用分类器。事实上,目前存在一些方法来提高跨被试准确率的效果,但是大多数是非深度学习方法或非深度学习和深度学习方法的融合。仍需要进一步研究基于深度学习的脑电信号处理来解决这一问题并提高跨被试准确性。
模型融合
多模型融合是脑电信号处理的一个有前途的趋势。
首先,大脑的特性尚未被充分探索。脑电图来源于我们大脑的神经活动,脑电图信号处理的目的是解码并获取我们大脑的信息。然而,目前很少有研究人员采用机器学习融合来关注算法有效性的解释,以及将算法与认知机制联系起来。虽然融合方法的有效性可以通过比较准确性等性能来间接证明,但每种方法到底提取了什么特征,以及特征的神经学意义是什么,尚不清楚,因此融合方法背后的认知机制尚不完全清楚。
其次,除了算法融合之外,多样本融合等其他融合方式也值得探索。范等人。 在一项研究中,使用多样本融合来使用SVM对EEG信号进行分类,其中来自相同实验条件的多个样本被组合以提高分类准确性。与单个样本相比,这显着提高了SVM分类的准确性。
第三,单一特征可能无法有效捕捉大脑的生理行为。未来的研究可能会引入更多参数来提高分类精度。然而,方法融合可能会导致时间和空间复杂度增加,导致训练和预测时间更长,从而限制了模型的实际应用。因此,平衡参数数量和时间成本很重要,以避免过度拟合和过高的时间和空间复杂度。
参考
Adadi, A., and Berrada, M. (2018). Peeking inside the black-box: a survey on explainable artificial intelligence (xai). IEEE Access 6, 52138--52160. doi: 10.1109/ACCESS.2018.2870052
Aellen, F. M., Goktepe-Kavis, P., Apostolopoulos, S., and Tzovara, A. (2021). Convolutional neural networks for decoding electroencephalography responses and visualizing trial by trial changes in discriminant features. J. Neurosci. Methods 364, 109367. doi: 10.1016/j.jneumeth.2021.109367
Awais, M. A., Yusoff, M. Z., Khan, D. M., Yahya, N., Kamel, N., and Ebrahim, M. (2021). Effective connectivity for decoding electroencephalographic motor imagery using a probabilistic neural network. Sensors 21, s21196570. doi: 10.3390/s21196570
Azizpour, H., Razavian, A. S., Sullivan, J., Maki, A., and Carlsson, S. (2016). Factors of transferability for a generic convnet representation. IEEE Trans. Pat. Anal. Mach. Intell. 38, 1790--802. doi: 10.1109/TPAMI.2015.2500224
Cano-Izquierdo, J. M., Ibarrola, J., and Almonacid, M. (2012). Improving motor imagery classification with a new BCI design using neuro-fuzzy S-dFasArt. IEEE Trans. Neural Syst. Rehabil. Eng. 20, 2--7. doi: 10.1109/TNSRE.2011.2169991
Gaur, P., Gupta, H., Chowdhury, A., McCreadie, K., Pachori, R., and Wang, H. (2021). A sliding window common spatial pattern for enhancing motor imagery classification in EEG-BCI. IEEE Trans. Instrument. Measur. 70, 1--9. doi: 10.1109/TIM.2021.3051996