手把手教你EEG脑电数据预处理-原理篇

更多技术干货第一时间送达

感谢简书ID:亚内士多德

授权分享

EEG脑电数据预处理-原理篇

本文不涉及具体的操作步骤,而是对脑电数据预处理中的每一步进行解说,根据我自己的经验来解释为什么要这么做,希望能够对刚入门脑电数据的朋友有所帮助。如果发现有什么错漏之处,也请指正。

基本步骤

  • 定位通道位置

  • 删除无用通道

  • 滤波

  • 分段

  • 基线校正

  • 重参考

  • 降低采样率

  • 插值坏导

  • 独立主成分分析

  • 剔除坏段

0. EEG data

  • 首先要认识脑电数据是什么样子。我们采集到的原始信号,是一系列随着时间变化而不断变化的曲线,如下图所示,这是一个8个通道的示例数据,一共有两种mark类型,分别为S1跟S2。

  • mark,或者event,或者trigger,其实表示的都是同一个意思,即在我们关注的事件发生时,打上一个我们认得出的标记,这样子就可以从我们收集到的一长段数据中,找到我们感兴趣的事件范围了。

EEG示例数据

1. 定位通道数据

  • 首先我们将EEG数据加载进eeglab之后,eeglab能够读取到的仅仅是每一个通道的名称和数值,但是它并不知道这个通道是位于头皮上的什么地方,因此我们需要加载进一个跟记录数据时相匹配的通道位置信息

  • eeglab中默认的文件是 standard-10-5-cap385,指的是按照国际10-5系统排布的一共有385个电极点信息的模板,一般来说使用这个模板就可以了。
    关于模板的更多信息还可以看这里《脑电定位系统》、《10-20国际标准导联系统

2. 删除无用数据

  • 在采集数据的过程中,有可能会记录一些后期并不需要用到的通道信息,这时候我们就可以将它们剔除掉,不必纳入后续的分析中。

  • 比如双侧乳突点。

  • 又比如眼电通道的数据。在使用eeglab来对数据进行预处理的时候,可以通过ICA的方式来去除眼电成分,而这种方式可以不需要眼电通道数据的参与就可以进行。

3.滤波

  • 滤波分为高通滤波,低通滤波,带通滤波和凹陷滤波。

  • 高通滤波是指,高于某个频率的信号可以通过,而低于这个频率的信号会被衰减过滤掉。而低通滤波则相反,指的是低于某个频率的信号可以通过,而高于这个频率的信号则相反。所以,在输入数值的时候,高通滤波要输入的是一个较小的数字,而低通滤波则是输入一个较大的数字。这可能跟我们的第一反应有点相悖。因此,也可以用它们的英文叫法来辨别,高通high-pass,低通low-pass,英文看起来就更为直观了。

  • 而带通滤波,指的是在某个频率段范围内的信号可以通过,而这个频率段范围以外的信号会被衰减过滤掉,就相当于同时做了高通滤波和低通滤波。

  • 凹陷滤波,指的是在某个频率范围内的信号会被衰减过滤掉,而这个频率范围以外的信号会被保留下来。这个操作通常是用来去除50Hz市电的干扰。我国的50Hz,因此在收集到的信号中,会有一个非常强烈的50Hz频段的信号存在,这就可以用凹陷滤波来去掉。

  • 值得注意的是,滤波并不能完全过滤出我们想要的频段。比如30Hz的低通滤波,并不是说30Hz以外的信号就通通被过滤掉了,而是以30Hz为截止频率,高于这个截止频率的信号会被逐渐衰减。

  • 如下图所示,横轴为频率,纵轴为增益系数,在截止频率f的左边,最开始的增益系数皆为1,指的是信号乘以1,被完整保留下来,而在接近截止频率的一定范围内,增益系数开始逐渐下降,直到我们的截止频率f处,增益系数正好是0.5,指的是经过了截止频率为f的低通滤波之后,f这个频段的数据有50%被过滤,而50%被保留下来。随后增益系数再逐渐下降,信号被逐渐衰减,直至接近于0。

  • 因此,我们有时候会看到数据在做了30Hz的低通滤波之后,还会再做一个50Hz的凹陷滤波,就是因为,并不是做了30Hz的低通滤波就能够完全把30Hz以上的信号全部过滤掉,而50Hz的干扰又是非常强的,所以最好还是再做一个50Hz的凹陷滤波。

低通滤波器

4.分段

  • 我们的数据是从实验开始到实验结束时全程记录的,但是我们感兴趣的,只是被试在接受到某个刺激,或者做出某个反应时那段事件的信号,因此,我们要根据我们打上的mark,讲数据切分成一段一段的,而在这些范围以外的数据,我们就不要了。

  • 一般的ERP分段在事件前200毫秒到事件后1000毫秒这个时间段就足够了,因为几乎所有的ERP成分,都是在1秒以内产生的。但是如果后期还要做时频分析的话,则需要将分段时间拉长,扩大到事件前1秒到事件后2秒这个时间段内,因为时频分析的算法,要求数据要有一定的长度。

5.基线校正

  • 在ERP实验中,我们关心的是这个刺激事件带给被试什么样的变化,因此需要有一个比较。而在事件发生之前的时间里,我们认为被试是处于一个相对平静的状态,此时的脑电活动,代表了一个平静状态下的脑电活动。所以我们将这段时间内的脑电活动当成一个基线,拿事件发生之后的活动去跟它做比较,来分辨刺激事件到底让被试产生了什么样的活动。

  • 一般来说,都是以分段中,事件之前这段时间来作为基线的,比如分段为-200毫秒到1000毫秒,那就将所有的数据,减去前200毫米以内数据的均值。换言之,,就是将这前200毫秒以内的数据均值当成是“海平面”,所有其他的数据的数值,都是相对于这个“海平面”数据的高度。

  • 基线校正的第二个作用,防止数据漂移带来的影响。有时候因为某些原因,我们采集到的数据,会呈现一个逐渐缓慢向上漂移的趋势,而在分完段之后,由于向上飘的影响,每一段数据的起点将不在同一个地方,也会使得这段数据的绝对波幅变高。而基线校正就可以校正这种漂移带来的影响,让每一段数据都拥有一个差不多的起点。

6. 重参考

  • 首先要解释的是参考的定义。我们看到采集之后的数据是一个个的数值,但这个数值是什么意思呢,就是电极所在位置跟参考电极之间的电位差。

  • 一般在脑电记录的时候会采用的参考电极有鼻尖参考,cz或头顶中央参考,还有单侧乳突参考,乳突就是耳朵后面一小块突起的区域。我们所看到的每个通道的数值,其实就是指这个通道跟参考通道之间的电位差。

  • 在分析数据的时候,有时候我们会想要转换参考点的位置。因为不同位置的参考,会对数据造成一定的影响。比如记录时采用的是cz或头顶中央参考,那么自然地,距离cz点较近的电极点,记录到的电位差会非常小,而离得远的电极记录到的电位差就自然会大一点,这种大与小的差异,并不是由认知活动产生的,而是由记录方式产生的。又比如,单侧乳突参考,那脑袋左边的电极点跟右边的电极点,也会存在着记录方式不同产生的电位差不同。

  • 常用的一些参考位置有双侧乳突平均参考,指将两个乳突数据的平均值作为参考数据,或者是全脑平均参考,指的是将全脑所有数据的均值作为参考数据的方法,不过使用全脑平均参考的时候要注意,眼电数据不要纳入其中,因为眼电数据的波动起伏非常大,很容易对数据造成比较大的干扰。

7. 降低采样率

  • 采样率的单位是Hz,指的是一秒内要记录多少个数据点的意思,比如原始数据的采样率是1000Hz的话,就是代表一秒内有1000个数据点。

  • 在后期分析的时候,我们有时候会想要降低采样率,比如降到500Hz或者250Hz。这样做最大的好处其实就是减小数据量,以提高计算速度,没有其他的作用了。所以这一步并不是必须的。

  • 但降低采样率需要注意两点,一是降低采样率要在滤波之后。因为降低采样率会使我们丢失高频信息,使高频信息变得扭曲,所以最好在保留了我们感兴趣波段之后再去降低采样率,这样可以保证信号最大程度不会失真。二是有一个采样定理,理论上来说,我们的采样率必须是我们想要分析的波段的两倍,比如我们想要分析60Hz的波,那数据采样率为120Hz就足够了。实际上,建议采样率最好在分析波段的三到四倍。

8. 插值坏导

  • 在做完上述这些处理之后,可以保存一下数据。因为在这之前的操作,是每个被试都需要做的基础操作,后期我们可以通过代码来实现批处理。而在这之后的操作,是需要根据每个被试的具体情况具体分析去处理的,因此只能一个个做,不能进行批处理。

  • 从这一步开始可以说是真正的去除伪迹的过程了。去伪迹大体分为两种,横向操作和纵向操作,横向即对通道进行校正操作,对数据不好的导联进行插值处理,纵向是指挑出数据不好的trials,删除掉。建议是先横向处理后再纵向剔除,尽量保留下更多的trials数。

  • EEGLAB中插值坏导有两种方式,一种是以某通道周围几个通道的数据的平均值,来替代这个通道的数据,这种直接通过代码实现即可。另外一种是EEGLAB里内置的一种算法实现,具体换算是什么过程我也不太清楚,但是我问过贾会宾老师,他是推荐使用第二种方法。原因在于,我们记录的是头皮脑电,头是一个球体,因此直接用周围数据的均值来代替这种方法有点粗糙,而EEGLAB内置的方法则会考虑到容积传导效应,以及近的点和远的点贡献的权重不同来进行插值,因此会更加有效。

9. 独立主成分分析

  • 这是一个很有用但也很难的方法,我并不是十分清楚它的原理,只能大概理解,也只能大概描述一下。前面说过,我们记录到的是头皮脑电,脑电帽上划出了一个个的点来表示位置,但是我们在FPz点记录到的数据,就真的是FPz点这个位置头皮下方的区域所产生的电活动?不一定。做过实验的都知道,眨眼会产生影响,左右看会产生影响,帽子戴得太紧导致肌肉紧张也会产生影响,还有左右的FP1,FP2处产生的电活动也会影响到FPz,甚至在离它最远的Oz点下方产生的电活动,也有可能对前方FPz点产生微弱的影响。因为真正的电活动产生于头皮下方颅骨内部,它经过了这么一层又一层的传播之后,不同源的电活动肯定会相互影响,从而导致某个记录点记录到的数据,混合了很多不同成分的电活动。而独立主成分分析,就是要对记录点的数据做一个逆运算,把每个记录点的数据, 分解成一个又一个的成分组成。然后我们再从中剔除掉伪迹成分,比如眨眼的成分,肌肉紧张的成分等,从而得到一个相对干净的数据。

  • 至于如何识别各种伪迹成分,可以看这篇文章《如何识别ICA成分

10. 剔除坏段

  • 预处理到了这一步,已经接近于完成了。最后一个步骤就是要剔除掉波幅超过100微幅的trial(要求严格一点也可以定位80),因为波幅起伏这么大的活动,已经不是由认知活动引起的了,肯定是由于其他的动作引起的,所以可以直接剔除掉。

  • 这一步操作一定要在插值坏导和ICA去除眼电成分之后再做,因为有可能被试眨眼比较频繁,那这么操作下来,有可能就需要删掉接近一半的trials数了,删掉的trials数太多,这个数据也就废了。所以要将它留到最后一步才做,同时,这个操作也能用来检查我们前两步操作是否足够有效。

更多阅读

ERP大神Steven Luck的线上ERP免费训练营调查

北大读博手记:怎样完成自己的博士生涯?非常具有指导性!

如何识别ICA成分

letswave7中文教程1:软件安装与脑电数据导入

letswave7中文教程2:脑电数据预处理-通道位置分配

letswave7中文教程3:脑电数据预处理-ICA去除伪影

letswave7中文教程4:脑电数据预处理-时域分析

这次我终于弄懂了院士、杰青、长江、百千万人才的区别了以及评选有多难了?评选条件了解一下

眼动追踪与VR

DEAP数据集--一个重要的情绪脑电研究数据集(更新)

EEG数据、伪影的查看与清洗

什么是EEG以及如何解释EEG?

Python-可视化Evoked数据

应用深度学习EEGNet来处理脑电信号

一种基于脑电图情感识别的新型深度学习模型

脑机音乐接口,高效检测用户的情绪状态

将深度学习技术应用于基于情境感知的情绪识别

EEG信号特征提取算法

EEGNet: 神经网络应用于脑电信号

信号处理之倒频谱原理与python实现

信号处理之功率谱原理与python实现

脑电信号滤波-代码实现

运动想象系统中的特征提取算法和分类算法

特征提取算法 | 共空间模式 Common Spatial Pattern(CSP)

功率谱估计-直接法原理与案例

MNE中文教程(16)-脑电数据的Epoching处理

DEAP数据库介绍--来自于音乐视频材料诱发得到的脑电数据

PsychoPy安装与测试案例

PsychoPy文字刺激、图片刺激和光栅刺激

Python机器学习算法随机森林判断睡眠类型

(0)

相关推荐

  • 基于EEG信号的情绪识别

          情感在日常生活中有着重要的作用,不仅在人类互动中,而且在决策过程中,以及在对我们周围世界的感知中.由于最近研究界对建立人和计算机之间的情感互动表现出兴趣,因此需要识别前者的情感状态.这可以 ...

  • 用于追踪认知任务期间的亚秒级脑动态的高密度脑电

    这项工作为社区提供了高密度脑电图(HD-EEG, 256个通道)数据集,这些数据集是在无任务和任务相关范式下收集的.它包括43名健康的参与者执行视觉命名和拼写任务,视觉和听觉命名任务和视觉工作记忆任务 ...

  • NeuroImage:警觉性水平对脑电微状态序列调制的证据

    <本文同步发布于"脑之说"微信公众号,欢迎搜索关注~~> 大脑的瞬时整体功能状态反映在其电场构型中,聚类分析方法显示了四种构型,称为脑电微状态类A到D.微状态参数的变化 ...

  • 基于EEG信号的生物识别系统影响因素分析

    摘要:由于指纹.语音或面部等传统特征极易被伪造,因此寻找新的生物特征成为当务之急.对生物电信号的研究也因此具有了开发新的生物识别系统的潜力.使用脑电信号是因为其因人而异,并且相比传统的生物识别技术更难 ...

  • 手把手教你EEG脑电数据预处理-操作篇

    更多技术干货第一时间送达 感谢简书ID:亚内士多德 授权分享 EEG脑电数据预处理-操作篇 关于EEG数据预处理的原理,前面已经介绍过了,大家可以查看<手把手教你EEG脑电数据预处理-原理篇&g ...

  • letswave7中文教程2:脑电数据预处理-通道位置分配

    更多技术干货第一时间送达 原始的脑电图信号是有噪声的.预处理对于提高信号的信噪比以获得"清晰"的脑电图数据是非常有必要的.但是,想要完全区分噪音和信号却是几乎不可能的.在脑电信号中 ...

  • letswave7中文教程3:脑电数据预处理-ICA去除伪影

    更多技术干货第一时间送达 ICA/BSS的理论与模型 独立成分分析(ICA)是一种盲信号分离(Blind Signal Separation,BSS)方法.ICA可线性建模如下图所示. 假设X为&qu ...

  • letswave7中文教程4:脑电数据预处理-时域分析

    更多技术干货第一时间送达 在本章中,我们将继续对ICA过滤后的P300数据集进行预处理. 说明,这部分的教程是基于前面几次教程的基础上进行的.所以要进行ICA预处理进行伪影去除,需要: 先导入数据&l ...

  • 手把手教你设置北上资金数据指标

    上一周介绍了如何在通达信使用跳空高开选股,发现了很多让卡尔哭笑不得的问题,文中的几个图已经把最终的界面展现出来,按部就班的抄都抄错,要么没有设置参数N,要么少了个冒号,或者分号写成冒号等等,大家照着葫 ...

  • MNE中文教程(16)-脑电数据的Epoching处理

    更多技术干货第一时间送达 Epoch概念简介 从连续的脑电图信号中提取一些特定时间窗口的信号,这些时间窗口可以称作为epochs.由于EEG是连续收集的,要分析脑电事件相关的电位时,需要将信号&quo ...

  • DEAP数据库介绍--来自于音乐视频材料诱发得到的脑电数据

    更多技术干货第一时间送达 DEAP数据库简介 DEAP[1](Database for Emotion Analysis usingPhysiological Signals),该数据库是由来自英国伦 ...

  • Python-使用多种滤波器对脑电数据去除伪影

    更多技术干货第一时间送达 一些由电源线造成的伪影具有某些特定范围的频率(比如,由电网产生的电力线噪声,主要由50Hz(或60Hz取决于实验的地理位置)的尖峰组成).因此可以通过滤波来固定. 本文分别使 ...

  • Python-生成模拟原始脑电数据

    更多技术干货第一时间送达 在实验中有时需要原始脑电数据来进行模拟实验,但又限于实验条件的不足,需要构造模拟的原始脑电数据. 本示例通过多次重复所需的源激活来生成原始数据. 案例介绍 # 导入工具包im ...