论文部分内容阅读
医学影像诊断是医学无创伤性诊断的主要方法之一。医学影像已成为疾病诊断、术前决策、手术导航和术后随访等临床工作的重要依据。面向医学图像的诊断技术研究作为医学和计算机科学的交叉学科,已成为国内外医学领域研究的重要方向之一。利用数据挖掘和计算机技术,对医学图像进行分析、计算、处理,从医学图像中挖掘出蕴含在图像内的丰富特征信息和规则,辅助医生进行医学图像临床诊断,具有较高的学术价值和广泛的应用前景。目前,面向医学图像的数据挖掘研究刚刚起步,现有的数据挖掘方法直接应用在医学图像还存在许多问题。研究和探索适合于医学图像的数据挖掘方法及其算法具有重要而现实的意义。粗糙集(Rough Sets)理论是由Pawlak教授于20世纪80年代初提出的一种用于处理不确定性和含糊性知识的数学工具,其基本思想是在保持分类能力不变的前提下,通过知识约简,导出概念的分类规则。它无需提供相关数据集合外的任何先验信息,适合于发现数据中隐含的、潜在有用的规律,找出其内部数据的关联关系和特征。近年来,粗糙集理论和应用取得了很大的成功,已成为软计算方法的一个重要分支,其涉及的领域包括模式识别、机器学习、决策分析和决策支持、知识获取等领域。本研究从医学数据的特点出发,综述了医学数据挖掘的一般步骤及关键技术和粗糙集理论及其在医学数据挖掘中的应用。根据本研究的需要也研究了数据预处理方法。在系统研究连续属性的离散化和属性约简的基础上,针对现有属性约简算法的不足,结合粗糙集理论、遗传算法以及决策表的特点,提出了一种基于启发式遗传算法的增强属性约简算法(Efficient Algorithm of Reduction ofAttributes based on Genetic Algorithm,EARGA),通过实验说明算法改进是有效的。在知识分类方面,本研究分析了粗糙集和决策树两种数据挖掘技术的各自特点,并且探讨了两种挖掘技术结合的可能性,提出一种基于粗糙集和SLIQ决策树相结合的分类新方法,弥补了大数据集分类效率不高的问题。将这种分类方法应用于医学图像分类之中,通过实验证明该这种新的分类方法同时具有有效性和可靠性。本文中所提到的算法全部在VC++6.0软件环境下得到了实现,实践表明研究成果可靠有效。