基于不完备决策表的属性约简及规则获取算法的研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:ytzhjx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高科技的飞速发展,全世界每天都有几十亿的人在使用手机、电脑和其他电子产品,产生了大量的海量数据。大数据从互联网向其他领域急速蔓延,各行各业都已经被数据给渗透,对于海量数据的有效处理成为目前研究的热点之一。在2015年的两会期间,李总理签订了国务院有关推进“互联网+”行动的指导意见,给互联网与传统行业之间的有效结合提供了政策依据。数据挖掘的发展优势越来越突出,占据了互联网的广阔天地。所谓数据挖掘就是对数据库中的数据,利用一些数据处理的方法,查找出在信息之间存在的内在关系的过程。包含数理统计、模式识别、神经网络等技术,广泛应用于电信、航空公司、政府和科学领域中。粗糙集是数据挖掘的方法之一,是一种用于处理不准确、含有缺省值的工具。相较于模糊集,它最突出的特点是不需要其他先验的信息,或附加的知识,就可以直接处理信息,找出海量数据中的隐含知识,应用于实际生活中。在数据挖掘的过程中,属性约简可以被看做为一个预处理的步骤,同时在粗糙集理论中占据了举足轻重的地位。属性约简可以定义为在保证知识库能够有效的区别库中含有的对象的前提下,将其中不能起到决定作用的属性消去。因此,在操作之后可以有效地减少知识库中的属性表示,同样也保证了对象基本信息的完整性。在将知识库中的冗余属性消去之后,在很大程度上降低了知识所占用的空间,有效的减少了成本支出。在目前的研究进程中,将粗糙集的属性约简分成了两种不同的类型,一种是包含全部的信息,叫做完备知识表,另一种中含有不确定的或者空缺的信息,命名为不完备知识表。完备知识表指的是在知识系统中所有的对象信息都是准确并且全面的,现在对于完备知识系统的属性约简探索相对来讲是比较全面也比较成熟的,在现实的应用中也施展出来了很大的引导作用。但是,实际生活中由于数据搜集设备的不可避免的误差,或者是搜集过程中环境的影响等情况,导致知识系统中会有一些信息缺失的情况存在,原有完备知识系统的算法已经不能适用于这种情况。对含有缺失信息的决策表的研究是未来科学家和学者们重点关注的地方。此外,规则获取是粗糙集理论中的一个比较实用的领域。随着信息爆炸式的增长,企业和各种组织积累了海量的数据,但是这些数据本身并不是有用的信息,在数据中的规则才是对企业做出有效决策提供帮助的信息,可以使企业在处理数据信息时有可靠的依据。因此获取决策知识库中的规则同样具有实用性。本文对当前学者在粗糙集中属性约简和规则获取中取得的研究成果进行了学习,在结合他们的基础上,进行了以下创新:(1)在不完备知识系统中,引入了基于粒度的差别矩阵,利用条件属性在区别对象时出现频率的属性约简思想,在粒度差别矩阵的基础上,构造了计算属性频率的启发函数。以知识粒度为启发信息,提出了新的约简算法,使得算法的时空复杂度都得到了很大幅度的降低,分别降为O(K|C||U|)(其中K=max{|TC(xi)|,xi∈U}和O(|U|),最后通过数据集进行仿真实验,证明了算法相较于同类算法有较高的时间效率。(2)介绍了LEM2规则获取算法总有属性-值对是在反复的被纳入候选属性-值对,然后又在程序的后面进行反向消除的缺陷,及一系列改进算法的不足之处,本文引入广义决策函数,在程序执行之前就先删除存在的冗余属性-值对,使它们无法参与后面的一系列操作,减少了属性-值对的样本空间,提高了求取属性-值对的效率。
其他文献
随着服务计算和虚拟企业技术的发展,通过Web服务实现业务流程的研究已逐渐成为计算机软件技术研究的热点。在Web服务环境下,业务流程由面向成熟规范的企业内部客户转变为面向
在CAGD (computer aided geometry design),CG (computer graphics)领域中,如何构造精确度高并且具有一定光顺性的曲面是一个重要问题。由于工程曲面的不规则性和复杂性,以及
近年来随着人工智能领域崛起,自动驾驶技术迅速发展。当前主流车辆自动驾驶系统期望通过车载设备和计算处理平台实现广域交通场景自动驾驶,该方案不仅成本高昂而且实现复杂难
随着计算机技术的广泛应用和互联网应用的逐步成熟,以及Web 2.0浪潮的兴起,许多企业都在自己的业务服务领域和日常工作中引入了基于B/S模式的计算机应用系统。如何建立一个健
图像降噪是图像处理的一个重要环节。图像在采集和传输过程中,往往受到噪声的干扰,而降噪的目的是尽可能的保持原始信号有效信息,同时除去信号中的噪声。近年来,小波理论得到
随着计算机技术尤其是互联网技术的蓬勃发展,越来越多的人开始接触并使用互联网,这促进了对基于互联网应用系统和软件的巨大需求,从而推动了许多新的研究领域和方向,也加速了
与其他多物品拍卖方式相比,组合拍卖通过允许竞标组合从而能更精确地表达竞标者对竞标物品之间关联价值的真实需求。由于竞标组合的不可分割性,使得竞标者避免了由于关联价值物
无线传感器网络涉及许多个学科,知识相互交叠,随着传感器技术、微电子技术、嵌入式计算、分布式处理和无线通信等技术的极大进步成为当今世界IT领域备受关注的研究热点之一。
人类通过视觉识别文字,感知外界信息。人脸是人机交互中相当重要的因素,通过人脸我们可以判定许多信息。利用人脸特征进行身份验证又是最自然直接的手段,它具有直接、友好、方便
在金融领域,软件系统的集成测试通常会涉及到多个遗留系统间的交互,并且单个系统的业务逻辑不会频繁变动。如何在黑盒或灰盒的状态下对多个跨平台跨组织的系统进行有效测试是