基于粗糙集的数据约简技术及应用研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:greathuhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能信息处理是当前信息科学研究中的一个热点问题。随着信息时代的到来,信息量不断增长,信息模式越来越复杂,因此对信息分析工具的要求也越来越高。针对以上这些问题,波兰华沙理工大学的Pawlak教授在20世纪80年代提出了粗糙集(Rough set)理论,主要用来研究不完整、不确定知识和数据的表达、学习、归纳。目前该理论已得到了国际众多学者的重视。 本文着重对粗糙集的核心问题之一——决策表的约简进行了研究。决策表的约简包括决策表属性的约简和属性值的约简两部分。具体研究内容如下: 首先主要研究了属性约简中基于差别矩阵的约简算法和遗传算法,通过实例应用,对它们的性能进行了分析;另外研究了属性的值约简算法,并通过实例应用对以核值为基础的值约简算法和一种启发式值约简算法做了比较。 然后深入研究了四种属性约简的启发式算法,MIBARK算法,CEBARKCC算法,CEBARKNC算法和属性频度算法。通过实例应用,对三种基于信息量的MIBARK,CEBARKCC和CEBARKNC约简算法在算法的起点、终止条件、时间复杂度等几个不同的方面进行了分析;另外还对属性频度算法进行了改进,并通过实验证明,与原有算法相比改进算法能够得到决策表的较优约简。 最后主要研究了粗糙集理论在入侵检测中的应用,并运用kddcup离线数据做了实验仿真。
其他文献
在因特网中,近总字节数的95%采用TCP进行传输,TCP端到端的拥塞控制策略对Internet的鲁棒性和稳定性具有重要的作用,拥塞控制一直是网络研究领域的热点之一。本文首先讨论了网络拥
对等网(简称P2P)技术是近年来业界研究与关注的一个热点,应用领域广泛,未来发展前景十分广阔。但是,P2P技术在发展过程中,也产生了一系列急需研究和解决的问题,通信安全就是
目前,随着电子政务系统信息化的发展,各种各样的电子政务信息积累的越来越多,信息孤岛、信息重复建设也越来越多,如何使政务信息资源具有应用程序可以理解的含义,并根据电子政务信
移动智能网技术发展到今天,已经在移动通信网上得到了广泛的应用,是运营商快速有效、经济而方便地生成和提供新业务的重要解决方案。近几年来移动通信市场的竞争愈加激烈,用户也
非正交的量子态是不可完全区分的,这是量子信息与量子计算的核心概念之一,在量子算法、量子密码等领域中扮演着关键角色。研究如何确定非正交量子状态的区分程度是信息论中的一
随着互联网技术的迅速发展,人们从Web上可以获得的信息资源越来越多,涉及到社会生活的各个方面,这也导致了网络信息过载(Information Overload)问题,从而促使Web挖掘技术和Web信
本课题针对目前市场上假冒伪劣产品的泛滥,将嵌入式技术和RFID技术相结合设计出了具体的酒类防伪系统,把嵌入式技术和RFID技术结合起来应用于防伪领域用以实现产品的防伪是防伪
基于Web的博士生教务管理系统是西安理工大学研究生综合管理系统的一部分,其目标是依托校园网和因特网,实现博士生教务管理工作的信息化。 作者根据Web信息系统体系结构模型
“IPv6多播技术研究及其在校园网中的实现”论文从该校IPv6校园网建设的实际情况出发,对IPv6的一些基础理论和应用展开了相关的研究并实现。 论文首先从IPv6协议的基本概念
在校园网络的管理中网络设备的管理是要首先解决的一个问题,因为网络设备需要管理的信息复杂、专业性强,直接决定着校园网的运行模式和使用情况,有必要建立一套适合各级网络