论文部分内容阅读
目前,大多数运动想象脑机接口的分类与识别算法,如在国际脑机接口竞赛中被广泛应用的线性判别分析,支持向量机等都只能进行离线分析,无法应对脑电信号的时变性以及被试或使用者状态的变化。因此,本文提出了一种运动想象脑机接口的在线分类与识别算法框架,并基于此框架提出了基于Stacking融合的在线分类与识别算法和基于bagging的在线分类与识别算法。主要研究内容如下:1.针对在运动想象实验过程中所采集的脑电信号是时变的和被试的状态容易受自身内在因素以及外界环境的影响而发生改变,提出了一种在线分类与识别算法框架。该框架通过对训练集进行更新并重新训练分类模型的方式来跟踪被试当前的状态和脑电信号的状态,以使分类模型能够更准确的对当前测试数据块进行识别。这里的训练集更新主要包括两个过程:训练集的扩充和时间节点靠前的旧样本的删除。此外,针对扩充训练集时加入新的样本的可靠性对分类与识别性能影响较大,提出了一种相对可靠的扩充训练集的方法,即根据高斯混合模型对分类器输出的类条件概率进行拟合而确定的阈值来选择相对可靠的新样本加入到训练集中。2.在扩充训练集时,虽然本文采用了一种相对可靠的训练集扩充方式,但并不能保证往训练集中加入的新样本是100%正确或不含离群样本,这会对基于单分类器的在线分类与识别算法产生很大影响。因此,为了抑制扩充训练集时加入的新样本中不可避免的会混入一些不可靠样本对分类与识别算法的负影响,本文首次尝试了基于Stacking融合的在线分类与识别算法,通过提高分类器的泛化性能来弥补不可靠样本带来的负面影响。3.其次,还尝试了基于bagging的在线分类与识别算法。基于bagging的在线分类与识别算法除了利用了bagging方法具有较好的泛化性能外,还利用了bagging算法在训练每个基学习器时所使用的训练集都是从原始训练集中通过自助采样法(bootstrap sampling)采样得到的特性,这一特性能够使得用于训练某些基学习器的训练集中可能不存在不可靠样本。此外,为了提高基于bagging的在线分类与识别算法的分类性能以及减少bagging的预测时间,本文利用遗传算法来选择bagging中基学习器的最优子集,即基于ga_bagging的在线分类与识别算法。最后,通过将上述几种算法在第三次国际比赛脑机接口的IVa数据集和第四次国际脑机接口比赛的IIa数据集以及实验室运动想象脑电数据这三个数据集上的应用结果发现,本文提出的基于Stacking融合的在线分类与识别算法在前面两个数据集上的分类效果要优于传统的支持向量机分类算法,在第三个数据集上的分类效果略劣于传统的支持向量机分类算法。然而,基于bagging/ga_bagging的在线分类与识别算法在这三个数据集上的分类效果都要明显优于传统的支持向量机分类算法。