论文部分内容阅读
心血管疾病已经成为危害人类健康的重大杀手。心电时间序列是人们诊断心血管疾病的主要依据之一。随着现代医学测量手段和技术的发展,记录了大量的时间序列。面对海量的医学数据,人们迫切地需要高能力和自动化的数据分析技术对它们进行有效的分析和诊断。自从心电图被发现的一百年间,研究者主要通过心电图的一些固定的模板或时间序列的相似性搜索去分析、处理心电时间序列,提取出各种特征波形,并以此来进行心电图的分析和诊断,取得了比较好的效果。但是,这种基于模板或相似性搜索的方法存在一定的缺陷。如果某些波形结构不与目前模板库中的任何一个模板相似,就不能识别出这些特殊的结构。但往往这种特殊的结构对于疾病诊断是非常有意义的。因此,本研究试图从一个新的不依赖于模板的角度进行深入的探索,即搜寻心电时间序列中和所有其他子序列最不相似的心电时间序列子序列。我们称之为心电时间序列的奇异结构(discords)。搜寻心电时间序列中的奇异结构,原本就有比较准确的算法,但是由于算法复杂,运行时间很长,很难在实际工作中应用。我们在研究国内外相关文献的基础之上,优化了原来搜寻奇异结构的算法,并充分利用现代计算机技术,选择Eclipse+Tomcat集成开发环境,使用Java+Matlab混合编程技术,在B/S模式下,采用经典的基于MVC设计模式的struts框架,开发了用于挖掘心电时间序列奇异结构的Web应用实验系统。该系统的整体框架结构是由解析模块、除噪模块、标准化模块、确定滑动窗口最佳长度模块、SAX模块、搜寻奇异结构和访问交互模块这7个模块整合而成。整个系统平台共计50余个文件,约1万行代码。与此同时,本研究还为应用系统搭建了基于网络的后台心电数据库,供用户通过Web应用系统进行搜索和使用。其数据主要来源于MIT/BIH标准心电数据和北京协和医院心电数据。用户可以通过浏览器访问本系统并且从数据库选择数据。系统能够快速、准确地定位心电时间序列中的奇异结构。本系统所发现的奇异结构与MIT/BIH数据库中的注释相符。在心电时间序列中搜寻奇异结构是一项新的技术。本研究仅在算法和实验平台方面进行了初步的实验,为进一步深入研究打下基础。心电时间序列中奇异结构的临床应用有待进一步的研究。