粗糙集属性约简算法设计与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:ty20011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是一门从大量的数据中挖掘出隐藏的有潜在价值知识的技术,是当今研究的热点内容之一。数据挖掘的技术有:决策树方法、模糊集方法、遗传算法、神经网络方法、粗糙集方法、数据统计方法等,其中粗糙集方法起到了非常重要的作用。粗糙集理论自1982年被提出以来,得到了许多研究者们的重视,近年来,其理论和应用方面都取得了极大的进展,在数据挖掘、智能分析以及机器学习等领域都用到了粗糙集理论及其算法。在数据挖掘领域主要是用到了粗糙集的属性约简算法,通过属性约简算法来缩减数据库中的数据量,从而能够使知识发现的时间更短,知识发现结果的质量更高。本论文针对属性约简算法做了如下几个方面的工作:(1)学习了数据挖掘和粗糙集的背景知识以及现存的一些典型的属性约简算法。现存的典型的属性约简算法有基于差别矩阵的属性约简算法、基于属性重要度和信息熵的属性约简算法、基于遗传算法的属性约简算法、基于动态规划的属性约简方法等。(2)提出了基于分类树的属性约简方法。该方法充分利用了树的结构特征来表示属性的分类能力,每个叶子节点代表的是对象集,叶子节点的个数代表了树的对应信息系统的分类情况。每个中间节点都代表了一个属性,中间节点的不同分支代表了不同的属性值。如果删除一个属性对应的列后,用信息系统中剩余的属性及值建立起来的分类树的叶子节点的个数不比删除之前少,则说明该属性是冗余的,在属性约简的过程中可以被删除。否则说明该属性是必要的,不能被约简掉的。(3)在基于分类树的基础上提出了最小属性约简算法。因为一般来说,属性的个数越少,挖掘出的规律也更具有代表性。所以研究最小的属性约简也是许多研究者们关注的主要问题之一。本文就是在基于分类树的基础上,用了分支界限法的思想,通过用尽可能少的组合次数来求出最小的属性约简。
其他文献
该文的第一部分借鉴已有的研究成果,并加以改进提高了自己的从XML数据到关系模式的映射算法.第二部分借鉴了当今数据仓库研究领域中的物化视图技术,并对视图的选取提出了改进
IEEE802.1X,也被称为基于端口的网络访问控制,是为大型网络(提供多种服务和连接设备)提供一种身份认证和授权的机制.该文的主要研究对象是IEEE802.1X标准关于身份认证授权的,以
本文是在开发了“网络型IC卡机房管理控制系统”的基础上写成的,主要研究了机房的自动化管理问题。 随着各高校机房数量的增多,机房规模的扩大,机房的管理压力越来越大。如何
该文综述了生物计算中的热点-DNA计算,给出了DNA计算的一些实际算法和模型.在第一章中,简述了DNA的结构和DNA计算所需的生物技术;第二章中,说明了以DNA为计算介质的计算具有
该文对目前计算机网络上存在的主要安全隐患做了全面的分析,对常见的网络攻击手段及相应对策作了深入的探讨和阐述.然后详细论述了防火墙和入侵检测等技术的原理与应用.在此
Internet的普及促使了电子商务的大发展,其业务需求的变化又导致了电子商务应用系统体系结构的变迁,该文在分析了三种体系结构的基础上,指出了当今电子商务应用系统的最合理
H.264/AVC是国际上最流行的视频编码标准之一, H.264比其它编码标准更具有高效压缩和高可靠传输的优势。然而,编码H.264视频会消耗大量处理器资源,导致编码速度较低,为此,学
本文围绕C2这种特定风格的软件构架,对构件组装涉及的多个方面进行了全面的研究.首先,作者以软件构架为系统模型,阐述了一个支持配置管理的软件构架XML描述方法.对于构件组装
WirelessHART协议是一种专门应用于工业过程自动化控制领域并具有安全与稳健的网络拓扑结构的无线网络通信协议。按照简单性、可靠性和安全性的设计准则,它提供了一种具有低
该文阐述了我们对软构件属性模型与语言的研究成果,引出了一组问题抽象,以便对目前软构件模型语言所做的描述进行改进.我们称新的模型为图形形式语言模型(GFL),以满足软件工