论文部分内容阅读
本文模仿人类认识事物的分层递阶原则,提出并且主要研究数据挖掘和信息融合的重要方法——粗糙集理论的分层递阶约简算法体系。 首先,本文提出粗糙集理论的分层递阶约简算法。该算法根据属性的获取方式、采集成本和实时性要求等对属性进行分类,使信息系统或者决策系统中的所有属性在单层次和单粒度上的知识表示变为部分属性所构成的知识在多种层次和多种粒度上的表示,从而可以逐层对信息系统进行约简。该算法非常适合应用于实际问题。 本文从信息理论的角度分别证明属性分层递阶不改变信息系统的信息熵和决策系统的互信息,从而使分层递阶约简算法体系具有严格的数学基础;分层递阶约简算法在某水泥窑炉控制决策获取中的应用证实其有效性。 其次,本文针对粗糙集理论中的两个重要数据处理过程——完备化和离散化,分别提出分层递阶约简算法的两个拓展算法;另外,引入一个分层递阶约简的拓展算法。 拓展算法一:不完备信息系统的粗糙集分层递阶约简算法将属性分为完备属性层和不完备属性层,然后分层递阶约简。本文证明该拓展算法使信息系统的信息熵(决策系统的互信息)减小,在信息理论意义上优于删除法、扩展法、默认值替代法和相似模型法等常用的完备化处理方法。并且,所得简约的应用可以避免属性获取方式复杂,采集成本高和实时性要求高等导致信息系统不完备性的原因。 拓展算法二:基于粗糙集理论和BP神经网络的分层递阶约简算法分别用粗糙集理论和BP神经网络处理决策表中的离散属性和连续属性,可以避免对象连续属性离散化产生的不确定性。同时,对于粗糙集理论比较敏感的决策系统噪声,BP神经网络可以较好地克服。 拓展算法三:引入统计筛选和线性判别分析相结合的分层递阶约简算法。该算法使分层递阶约简算法从简单的属性分层处理拓展至属性选择和属性压缩处理。 本文对分层递阶约简的三个拓展算法都进行详细的性质分析和实例验证。 最后,本文提出若干拓展思路,可以将分层递阶约简算法拓展,得到许多相关算法或者与其它人工智能算法结合形成针对某类问题的新型分 摘要层递阶约简算法。