论文部分内容阅读
波兰学者Z.Pawlak,于1982年提出了粗糙集理论这种可以应用于众多领域的数学工具,该理论在无先验知识的基础上,通过对数据集的计算来解决实际问题。但该理论是建立在严格的包含关系上的,缺乏对某种程度上的包含的处理能力,因此对噪声数据不能很好适应;且传统粗糙集理论对于论域的分类是基于单个等价关系的,从粒计算的角度分析,传统理论是单粒度单层次的,缺少对信息的多角度处理。为解决上述问题,Ziarko在粗糙集理论中引入变精度概念,使粗糙集理论有了容错能力,为近似决策规则的获取奠定了理论基础;钱宇华和梁吉业等提出,采用多个不可分辨关系针对论域进行层次划分,构造论域空间。从而在多粒度的论域空间上针对目标决策进行概念的近似逼近。通过这种改进,提出了多粒度粗糙集模型,使得Pawlak经典粗糙集理论具有了多角度处理信息的能力,进一步推动了粗糙集理论的发展。在此基础上发展出的可变精度多粒度粗糙集模型结合了变精度粗糙集模型和多粒度粗糙集模型各自的优点,兼具对噪声数据的容忍能力和多粒度、多角度分析解决问题的能力;而另一方面,张明等在多粒度粗糙集的基础上,综合考虑知识粒度质量和数量,提出了基于加权粒度的多粒度粗糙集模型,该模型对知识粒度的考察较为全面,可以更好的适应多粒度粗糙集模型的应用环境。但上述两种改进模型也存在着各自的不足,本文在上述模型的基础上,进行分析改进,取得了如下研究成果:变精度多粒度粗糙集模型的变精度阈值是单一的,而多粒度粗糙集模型是从多角度、多层次处理数据,其处理的数据往往是多源的或者是分布式的,噪音数据的含量也各不相同。因此,不同知识粒度层次所应具有的变精度阈值也不相同,这使得现有的变精度多粒度粗糙集模型难以适应现实生活中多粒度的应用环境。通过分析上述缺点,本文提出了基于多重阈值的变精度多粒度粗糙集模型,该模型使得不同知识粒度层次的变精度阈值可独立调整,更符合多粒度粗糙集模型的数据特征,该模型更好的结合了多粒度粗糙集模型和变精度粗糙集模型,可从多角度分析解决问题又兼具更灵活的容错能力。基于加权粒度的多粒度粗糙集模型在选择知识粒度时,仅考虑知识粒度权重的简单累加,没有考虑到知识粒度权重的分布情况,不符合实际问题的求解需要。在分析上述问题之后,本文从知识粒度的权重分布角度,提出了基于权重分布的多粒度粗糙集模型。定义了基于权重分布的多粒度粗糙集模型的两种常见形式,即基于权重组合分布的多粒度粗糙集模型和基于权重平均分布的多粒度粗糙集模型,给出了模型的相关性质,通过实例和仿真实验验证了该模型的有效性。