论文部分内容阅读
粗糙集理论由波兰学者Pawlak Z.于1982年首次提出,它是一种新的处理模糊和不确定性问题的数学工具,已被广泛应用于知识发现、机器学习、决策支持、模式识别、专家系统及归纳推理等领域。属性约简是粗糙集理论中的重要研究内容,核属性的求解又是多数启发式属性约简算法的关键步骤,因此,对属性约简与核属性求解进行研究,具有重要理论意义与应用价值。本文对粗糙集理论中的属性约简算法与核属性求解算法进行了系统深入的研究,主要研究内容如下:(1)提出了一种基于条件熵的相对属性约简方法。通过对已有属性约简算法的深入分析,发现这些算法在约简过程中都是仅仅考虑属性的增减,而没有考虑论域中对象数量的变化对约简效率的影响,即在约简过程中论域中对象数是不变的,这使得划分运算时进行了许多冗余运算。针对这一问题,本文提出了一种新的决策表属性约简算法,该算法通过不断将决策表中一定属性集下协调的部分从论域中去除,把不协调的部分作为新的论域做进一步处理,逐步减少参与属性约简的对象数,可以在一定程度上降低求取属性约简的计算量,实例表明该算法是有效的。(2)提出了信息观下属性核的增量更新方法。通过分析决策表中论域更新时决策属性关于条件属性的条件熵的变化机制,建立了其变化的定量关系,并提出了一种基于条件熵的增量核求解算法。算法中计算新的条件熵时对于加入新对象后决策表的不同变化情况都采用了统一的计算公式,只需找到与新对象属性值相等的条件类和决策类就可以计算出新的条件熵,进而得到信息观下新决策表的属性核。该算法可用于在信息观下增量属性核的动态更新。这些研究成果不仅丰富和发展了粗糙集理论,而且为海量数据的决策提供了有效的处理技术。