论文部分内容阅读
众所周知,睡眠对于每一个人来说都具有很重要的意义。对处于社会巨大压力下的人们来说,睡眠是一天中最重要的放松方式。人们越来越关心自己的睡眠状态,对于睡眠阶段进行精细的划分成为了近几年来研究的热点。然而在对不同睡眠阶段进行正确的识别的过程中存在着很多困难,本课题的重点是针对在睡眠阶段分类过程中易出现的问题,分别提出解决方法,对传统的分类模型进行改进,从而得到性能更加优良的分类模型。本文的主要工作如下:(1)对数据库中的单通道脑电信号进行多角度分析,完成特征提取。单通道采集的脑电信号可用于分类的信息往往很少。因此进行充分的特征挖掘和提取尤为重要,本课题从多个角度进行分析,包括线性分析、非线性分析和多域分析,从不同尺度和角度看待脑电信号在睡眠阶段过程中体现出的规律性。提取了AR模型的AIC参数、符号熵、子频带能量比等特征值。通过相关系数和穷举法对特征值进行组合,将组合的特征值作为模型的输入进行训练,最后选择测试结果最为理想的特征值组合作为接下来模型的输入。(2)分析传统分类算法的分类效果和缺点。采用传统K-最近邻方法(KNN)和最小二乘支持向量机(LS-SVM)算法进行单一训练(训练集和测试集取自同一样本)。分类结果中睡眠阶段2期所占的比重大大提高,KNN、LS-SVM分类模型表现出极强的结果倾向性。采用以上两种方法进行多样本交叉实验得到的效果很差。为了研究产生该现象的原因以及提高分类器的性能,进行接下来的研究。(3)类不平衡数据集的重构。采用算法层和数据层相结合的GAK-KNN算法对不平衡数据集进行重构。GAK-KNN算法是K-means、GA遗传算法和加权KNN相结合的一种算法,基本原理是对少数类样本进行扩充,通过权重对边缘化或者产生干扰的样本进行弱化。进行扩充的样本与原始数据相比没有信息的重复,避免产生过学习的情况。最终通过Sleep-EDF Database Expanded数据库的样本对该算法的有效性进行了验证。(4)基于迁移学习的睡眠分期算法的研究。不同受试者采集的EEG分布差异往往很大,为了得到良好的分类模型,往往要对受试者提前进行训练样本的采集。这一过程往往使效率变得低下,因此引入迁移学习的方法。本文采用基于相似度系数的多源BP神经网络算法(MTL-BP)和Tr Adaboost+KNN算法。最终通过睡眠数据库的样本对该算法的有效性进行了验证,宏平均值和总体精度相比传统的监督学习都得到了明显的提升,提升范围为10~30%。