论文部分内容阅读
在知识发现的诸多理论之中,粗糙集理论是一种对处理复杂数据较为有效的方法,它并不要求提供问题所需处理的数据集之外的任何先验信息,并且与其它的处理不确定性问题的理论有着很强的互补性。在粒计算意义下,经典的粗糙集模型是基于单粒度的,即其目标概念的上、下近似是通过单一属性下的二元关系来刻画的。当面对多源数据、高维数据或分布式信息系统等时,经典的粗糙集将表现出一定的局限性。在此研究背景下,Qian、Liang等人将多粒度的思想引入到了经典的粗糙集模型中,提出了多粒度粗糙集模型。尽管目前多粒度粗糙集的研究工作取得了很多成果,但大多数学者都将精力投入到了提出多粒度粗糙集的拓展模型中,以提高经典模型的建模能力,却很少有人研究在多粒度粗糙集模型下的知识发现方法。在多粒度粗糙集模型下如何高效可行地实现对数据集的有效的知识发现应当予以重视。为此,本文以多粒度粗糙集理论为研究背景,对基于多粒度粗糙集的知识发现方法进行了系统性的研究,主要研究了以下内容:(1)研究了在多粒度粗糙集模型下如何对信息系统进行信息粒化,以得到粒度空间和信息粒。与此同时,本文对于在多粒度思想下如何进行信息系统的信息粒化也做了一定的阐述。(2)提出了基于多粒度粗糙集的规则提取方法。它主要包含了粒度选择方法、粒选择方法和基于多粒度粗糙集的规则描述。其中,本文提出的粒度选择方法使用的是一种启发式策略,消除了信息系统中对目标概念近似作用并不大的相对冗余的粒度空间,以得到某个相对较小的粒度空间集;粒选择方法则采用了一种乐观策略,去掉了用于描述决策属性下近似的信息粒集合中对提取具有较好泛化能力的决策规则意义并不大的信息粒,以获得一个具有极大覆盖性质的粒集;基于多粒度粗糙集的规则描述是将最终求得的信息粒集合中的所有对象都描述成多粒度粗糙集模型下的决策规则。(3)研究了如何将基于多粒度粗糙集的知识发现方法运用到多粒度粗糙分类器的设计之中;与此同时,通过实验证明了基于多粒度粗糙集的规则提取方法(特别是启发式的粒度选择方法和乐观的粒选择方法)的有效性。本文对多粒度粗糙集的知识发现方法进行了系统性的研究,提出了基于多粒度粗糙集的规则提取方法,通过使用该方法,信息系统中对目标概念近似作用并不大的粒度空间和相对冗余的信息粒都能得到一定程度的减少,进而用提取出的决策规则所构建的多粒度粗糙分类器将拥有更好的泛化能力。