论文部分内容阅读
由波兰数学家Z.Pawlak提出的粗糙集理论(Rough Set Theory)作为一种能够有效分析和处理不精确、不一致的各种不完备信息系统的数学工具,近年来越来越受到众多学者的关注和研究,并取得一些令人瞩目的研究成果。目前,在人工智能领域的研究中,粗糙集理论已成为一种不可或缺的研究工具,并广泛运用到模式识别、知识发现、属性约简等各项学术领域中。Z.Pawlak教授提出的粗糙集理论必须是以完整的信息系统为前提,以等价关系为基础,从大量信息中发现隐藏的知识,寻找潜在的规律。但在实际应用中,由于环境变化、技术滞后等一些客观因素导致我们所收集的数据信息缺损、遗漏等不确定性现象普遍存在,通常我们获取的数据信息大部分都是不完备的,并且数据之间的关系多为相容关系。因此有必要将等价关系弱化为相容关系,对粗糙集理论中的上、下近似集进行适当的修改并定义合适的概念,建立推广的粗糙集理论模型并研究信息表中属性的不确定性,已成为一个非常重要的研究课题。因此,本文以Kryszkiewicz相容关系为基础,针对改进型相容关系模型在不完备信息系统属性约简中存在的较大的误差,引入不完备信息系统对象的先验概率,并结合量化相容关系的思想,提出了相容关系模型的推广,并以推广的模型为工具对不完备信息系统进行属性约简,通过实例验证属性约简算法的可行性。粗糙集理论的数学基础是集合论,难以直接处理连续性的属性,而现实中的不完备信息系统存在的属性不仅包含离散性属性还包含连续性属性。因此处理离散性属性和连续性属性并存的不完备信息系统是制约粗糙集理论实用化的难点之一,本文将从相容关系理论的适用范围出发,以连续性属性离散化为根本出发点,以尽量减少离散化时决策表信息损失为目标,推出新的相容关系模型来获得决策所需要的知识,最后通过实例与其它的离散化方法进行比较,表明该模型是有效可行的。