论文部分内容阅读
知识发现(Knowledge Discovery,KDD)是20世纪90年代初期发展起来的一个活跃的研究领域。近年来,随着知识量的剧增,它已成为目前人工智能和数据挖掘(Data Mining,DM)的研究热点。知识发现就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中运用统计学、粗糙集、模糊数学、机器学习和专家系统等多种数学工具和方法提炼出抽象的、隐含在其中的、人们事先不知道的客观世界的内在本质和联系。粗糙集理论是分析和处理这类不精确、不完备、不一致数据的有效数学工具。本文主要研究了基于粗糙集理论的几类知识发现方法及其约简算法,并将所研究的算法应用于心电信号的自动分析与诊断中。论文主要研究内容如下:1.研究了粗糙集的基本理论与约简算法。针对Pawlak经典近似精度没有考虑知识粒度对精度影响的不足,提出了近似精度定义的改进并讨论了其性质,改进后的近似精度既能够体现知识粒度的划分细度情况又保持了原定义的基本思想。分析了一系列的经典约简理论,提出了基于依赖度约简算法的改进,改进后的算法不论是在计算复杂性和时间复杂性方面都有较大程度提高;针对小样本问题,提出了不协调信息系统的约简方法,该方法避免了在处理一些实际应用中由于样本数据不充足而可能导致的有用信息丢失的问题,比如临床医疗诊断数据和UCI机器学习数据。实验表明该方法是有效的。2.研究了基于粗糙集的粒计算模型,讨论了粒计算的一些重要性质以及约简算法。针对没有约简核的系统,提出一个新的约简算法,该算法既可以用于有约简核的系统也可以用于没有约简核的系统,并通过实验证明了该算法的可行性。3.提出了基于属性粒的认知模型。研究了认知过程的形成机理,分析了认知信息粒的本质并讨论了它的一些性质以及应用。研究了基于认知结构的信息分类和信息约简,提出了一个利用知识依赖度和属性重要度相结合的约简算法。4.以心电图(ECG)自动分析作为应用背景,提出了一个基于黄金分割与小波变换相结合的特征提取算法,将所提取的特征建立了信息系统。利用本文所提出的粗糙集的知识发现方法对信号进行了特征选择和规则挖掘。