论文部分内容阅读
由于信息科学快速发展,每时每刻都能收集到大量的数据。面对如此大量需要及时分析处理的数据,已有的分析工具、算法面临着越来越严峻的挑战。Pawlak粗糙集理论是处理不确定性和模糊性知识的数学理论,为数据分析提供了一种有效的方法。但经典的Pawlak粗糙集建立在等价关系上,不能有效地处理不完备的离散型数据以外的数据,在动态数据的处理上也存在短板。因此,对Pawlak粗糙集模型进行推广是主要研究工作之一,其中覆盖粗糙集模型是备受关注的推广之一。本文提出了最大描述下的覆盖概率粗糙集,覆盖粗糙集理论及其约简。此外,针对动态覆盖信息系统、动态不完备信息系统,分别讨论了粗糙集计算的矩阵构造问题以及基于矩阵的增量更新方法。具体的创新性研究成果主要体现在以下方面:(1)基于最大描述集的极小邻域,提出了一类覆盖概率粗糙集,并讨论了其重要性质。根据对象与集合之间的不确定隶属关系,进一步探讨了覆盖概率粗糙集的模糊性,丰富了覆盖粗糙集理论。(2)建立了一类基于元素最大描述的覆盖粗糙集,给出了与经典粗糙集理论相对应的覆盖粗糙集的基本性质,并讨论了不同覆盖生成相同覆盖近似算子的充要条件以及一个覆盖的约简。最后,通过构造区分矩阵来给出覆盖信息系统的约简与核心的判断定理,从而给出了求覆盖信息系统约简的一种方法。(3)在覆盖个数动态变化的背景下,针对如何高效、迅速地计算集合的近似算子、正域、负域、边界域等问题,根据特征函数的概念,定义了一个关系矩阵,提出了近似算子、正域、负域、边界域等的矩阵表达式。其次,基于覆盖个数变化,研究和讨论了集合近似集的矩阵增量更新方法。最后,以一般二元关系讨论了所构建矩阵的相关性质以及其与粗糙集不确定性的联系。得到的结果不仅丰富了覆盖粗糙集的动态知识更新理论,而且为动态覆盖信息系统中知识更新提供了一种新的途径。(4)分别针对属性个数变化对象个数不变、对象个数变化属性个数不变探讨了不完备信息系统优势关系下粗糙集计算的矩阵更新方法。