论文部分内容阅读
心电信号是人体心脏电生理活动的反映,自从上世纪初心电图机问世以来,人们一直致力于通过心电图进行心脏疾病的研究。随着信息技术的发展,利用计算机结合人工智能技术进行心电信号的自动分析已经得到广泛应用。然而由于心电数据采集环境的限制以及医生诊断可能存在的错误,心电信号自动分类领域存在训练样本错误标记的问题,会使得心电分类成为弱监督学习,分类器会被严重破坏,分类准确率明显降低。本文针对这一问题提出了基于交叉验证的识别方法,对训练集中可能存在的错误标记样本进行识别,提升了分类性能,取得了满意的效果。另一方面,由于心电信号相对稳定且防伪造和窃取能力强,其应用也不再仅限于心脏疾病诊断,而扩展到身份识别等领域。尽管已有不少相关工作,但是运动心电身份识别还有待进一步研究,该鲁棒性问题限制了心电身份识别的实际应用。针对该问题,本文建立了运动心电数据库,对运动心电身份识别的可行性进行了探讨。第一章,介绍本文的研究背景和研究意义,回顾了心电自动分析和心电身份识别的发展现状。第二章首先详细介绍了心电信号的产生机理和波形特点,然后介绍了心电图机的导联系统和心电研究领域广泛使用的数据库。在第三章中梳理了心电信号处理的主要流程。在心电预处理中介绍了小波变换法和中值滤波法。在心电波形检测中介绍了动态阈值法,在心电特征提取中介绍了时域特征、形态特征和频域特征。最后在分类算法中介绍了支持向量机、决策树、线性判别分析、朴素贝叶斯和k近邻算法。第四章则讨论在心电自动分类中存在的错误标记训练样本问题。针对该问题,本文针对前人提出的基于遗传算法的错误标记样本识别方法存在的问题,提出了一种基于交叉验证的多种机器学习算法结合的方法,并在经过人工添加错误标记噪声的MIT-BIH心律失常数据库上进行实验。结果表明经过基于交叉验证的识别方法去除错误标记训练样本后,分类性能指标得到明显改善。其中,以总体分类准确率为代表,如果训练集中错误标记样本的比例在20%以下,那么总体分类准确率可以回升至与没有人工添加标记噪声时相当的水平。如果错误标记样本比例达到30%,则总体分类准确率可以回升到比无人工添加标记噪声时略低的水平。而如果错误标记样本比例达40%,则经过本文方法处理之后的总体分类准确率仍然远高于不进行错误标记样本去除的情况。在第五章中,针对运动状态改变对于心电身份识别造成的困难,利用本课题组采集的运动心电身份识别数据库探讨运动心电身份识别的可行性。本章首先介绍了运动心电身份识别数据库的详细信息,并分析得到运动心电身份识别的关键在于提取出运动前后保持相对稳定的特征。然后将当前心电身份识别领域比较成熟的特征提取和选择方法在运动心电身份识别数据库上进行实验。实验结果表明现有文献提出的心电身份识别方法在静止状态下取得了不错的效果,但是运动状态改变的情况还有待进一步研究。