论文部分内容阅读
信息粒化的基本思想出现在许多领域,如粗糙集、模糊集、证据理论、聚类分析、数据库、机器学习、数据挖掘等。从1979年L.A.Zadeh在世界上首次提出并讨论了模糊信息粒化问题之后,信息粒化得到人们越来越多的关注。经过二十多年的发展,预计在不远的将来,粒度计算将会在软计算、知识发现、数据挖掘中扮演越来越重要的角色。 本文跟踪国际学术前沿,在粗糙集理论框架下,以粒度计算方法为前提,借鉴已有的软计算理论成果,对一些粒度计算理论与方法进行了深入的研究,不仅从理论上丰富和发展了该理论,而且由于其广泛的应用背景,这些结果同样具有重要的应用价值。 本论文主要研究了以下若干问题: 1.在粒度计算和粗糙集理论的融合方面,提出动态粒度原理。由于经典粗糙集概念刻画的非动态性,本文讨论了粒度意义下的粗糙集近似,并定义了动态粒度下的正向近似和逆向近似,给出了它们的一些性质,为粒度计算和粗糙集理论提供了新的研究角度。另外,本文从粒度的角度讨论了近似分类结果和原有分类对象的协调度问题,并提出了一种基于动态粒度下正向近似的近似分类算法,实验表明该算法的有效性。基于正向近似思想,本文还给出了一种新的决策表规则挖掘算法,实验表明该算法相比其它算法简单有效。 2.在刻画信息系统中的粒本质方面,提出粒度公理化定义。为了刻画和度量知识之间的贴近程度和差异程度,本文统一了完备信息系统和不完备信息系统中的知识表示,引入了知识贴近度和知识距离的概念,证实它们之间满足严格互补关系。考虑到知识粒度的刻画和定义潜在地遵循一些规则,本文给出了知识粒度的公理化定义,并且证明原有的知识粒度都是这种粒度定义下的特殊形式。从知识粒度公理化定义出发,可以针对不同研究对象定义不同的知识粒度。此外,本文还建立了知识粒度和信息熵之间的关系,证明知识粒度和信息熵之间满足互补关系,提出了信息守恒猜想及其推论,认为在一个给定的知识空间中,所体现出来的信息含量和有粒度变化所引起的隐藏信息量的总和应当是守恒的。 3.在信息熵理论研究方面,提出组合熵和组合粒度理论。首次提出