论文部分内容阅读
由波兰的Pawlak教授提出来的经典粗糙集理论,其是建立在完备信息系统中不可分辨关系之上的,这种分类对数据的完整性和精确性要求很高,并且需要具备离散的属性。然而在现实世界中,由于数据的测量误差、数据获取的限制等因素,使得信息系统是不完备的,因此将不完备信息系统引入到粗糙集中。然而值得注意的是,代价敏感学习已经在很多领域占据着很重要的地位了,但数据代价的问题很少在不完备信息系统中被提起,所以对粗糙集的代价敏感度进行研究很有意义。本文对不完备信息系统进行研究,使用粗糙集理论作为数学工具,对不完备信息系统中的粗糙集的代价敏感进行了研究。本文主要有以下两方面的创新内容:(1)Yao提出的决策粗糙集方法,该方法在完备信息系统下利用错分类代价与延迟决策代价所形成的代价矩阵求得的一对阈值来构建粗糙集模型。值得注意的是,Yao的决策粗糙集模型是在完备信息系统下构建的。然而,在现实世界的应用中,由于数据的遗漏、获取的限制以及人们对数据的主观理解导致研究者得到的信息系统往往是不完备的。因此,经典决策粗糙集理论在解决此类问题显示出了不足的一面。对于未知的属性值,本文将容差关系应用到决策粗糙集中,构建了基于容差关系的决策粗糙集;对于同时具有遗漏和缺席的未知属性值,本文将最大相容块技术应用到决策粗糙集中,构建了基于最大相容块的决策粗糙集模型。(2)与此同时,Yao仅使用了一个代价矩阵的形式来描述了执行决策后所需付出的代价,使得其不能够广泛的处理实际中存在的问题。说明代价具有的多样性和变化性以及时效性并没有被Yao的决策粗糙集所考虑,使得决策粗糙集不能更具有实用性。为解决上述问题,本文将多重代价矩阵引入到的决策粗糙集中。然后,在不完备信息系统中,分别提出了乐观与悲观两种形式的多代价决策粗糙集方法,讨论了这两种多代价决策粗糙集模型与单代价矩阵决策粗糙集模型之间的关系,并且给出了乐观与悲观这两种多代价决策粗糙集决策代价的总代价计算公式。最后通过实验结果表明,乐观多代价决策粗糙集得到的决策代价是一种较优的代价,并且代价的值将会保持在一个稳定的值。