论文部分内容阅读
心电图(Electrocardiogram,简称ECG)是反映心脏兴奋的电活动过程,是人类生命活动中一个明显的体现。心电图反映了人体心脏的工作状况,它的各个波形的不同变化往往体现出了某些病变。在现代医学中,心电图正越来越成为医生诊断心脏疾病的依据。动态心电图(Dynamic Electrocardiogram)长时间地记录心脏的状况,一般在24小时内记录近10万次左右的心跳所产生的心电图。由于记录时间长、数据量庞大等原因,医生不可能阅读每一次心动事件用于心脏病诊断,如何准确、可靠、完整、快速地从中抽取各类典型心电数据充当诊断依据,成为当今研究的热点。机器学习(Machine Learning)是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习的理论方法可被用于大数据集的数据挖掘这一领域。当前,机器学习研究与应用中最常用的关键技术有:集成学习、贝叶斯网络、决策树、统计学习理论与支持向量机、隐马尔可夫模型、神经网络、k近邻方法、序列分析、聚类、粗糙集理论、回归模型等。本文以动态心电图波形为研究对象,研究动态心电图波形数据的采集、整理、预处理,引入机器学习的概念,通过比较和分析确定一种分类算法并加以改进。具体内容包括采用小波变换及阈值检测的方法检测R波,并以设计一套动态心电图波形自动分类系统为目的,将聚类方法与分类方法相结合,在已完成聚类策略的筛选之后,通过对比不同分类方法在动态心电图波形分类中的优劣,确定了K近邻(KNN)分类策略,并对波形间的度量加以改进。具体内容为:首先对相似性度量中不同距离度量方法的比较,将传统的欧式距离改为City Block距离,并引入了核函数的概念,将波形数据间的线性差异转化为非线性,在一定程度上提高了波形间的区分精度,最终使得动态心电图波形的分类准确度得到了提高。提出了基于SOM和相似性搜索的二次筛选策略,在完成初次筛选后对未满足筛选要求的剩余波形进行了细分筛选,基本达到了用于疾病诊断的要求。