不完备决策表属性约简和求核算法

来源 :广西师范大学 | 被引量 : 3次 | 上传用户:placaptain
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现在在全世界范围掀起了一股股IT浪潮,例如云计算和物联网的兴起、移动通信服务进入了4G时代、大数据时代的到来等。这些IT革命使人类的工作生活更加便捷和轻松。特别是大数据时代,现在要处理的数据都已经到PB级别,这也加大了数据处理的难度。粗糙集是一个优秀的数学工具,尤其在处理不精确、不完备、不一致数据表现突出。粗糙集理论是人工智能与模式识别共同研究所得到重要研究成果之一。粗糙集的最大特点是不要任何先验知识,不需要其他额外数据信息就可以达到处理数据的目的。属性约简和求核一直都是粗糙集理论的热门研究重心之一。属性约简的目的是在不改变原始数据背后的隐藏规则和数据关系的前提下,尽可能化简原始数据。属性约简又划分成无核属性约简和有核属性约简。无核属性约简是根据某些模型或者启发信息来进行约简。有核属性约简则是要先在计算核属性的基础上,然后在进行约简。其实,核属性是所有属性约简的交集。因此,求核是非常有意义的研究课题之一。同时,如今关于粗糙集的属性约简和求核的探讨多半是作用在完备决策表中。在实际情况中,由于数据丢失、信息不确定或者噪声数据影响,使得信息系统中存在空值或者遗漏信启、。然而以往的经典的属性约简和求核方法已经不适用于这种情况。这也导致了研究不完备决策表的属性约简与求核是一种新的趋势。王国胤教授针对不完备信息系统制定了容差关系、限制容差关系、相似关系等。各国学者则使用了正区域、矩阵、信息量、知识粒度等方式来计算不完备决策表的属性约简和求核。本文首先简单介绍了粗糙集的发展历程及相关概念,然后针对不完备决策表先后使用冲突域和限制容差关系来求解属性约简和属性。下面将从三个方面论述本文的研究工作:(1)在不完备决策表中的首先用分步计数的方法求出容差类,这比之前给出的算法更加高效且易于理解。通过自己给出的冲突域的定义结合矩阵思想构造出布尔冲突矩阵的模型,然后通过矩阵的逻辑运算和属性重要度的定义,逐个找出约简后的属性。这样的方法相比以往的差别矩阵的属性约简方法是一种创新的方法,在时间效率也有不错提高。其中新设计的算法时间复杂度为max{O(、|K||C||U|),O(|C|2|POSC(D)||U|)},空间复杂度为0(|C|2|POSC(D)||U|)。(2)在关于核属性研究时,首先给出了冲突域的定义和在冲突域下的决策表的核属性判断方法。通过相比于普通正区域,冲突域可以减少元素决策值的比较次数,这样在算法效率上有所加强。在此之前,在计算容差类时用了链式基数排序的方法,这一步大大降低了算法的时间复杂度。该求核算法的时间复杂度为O(|K||C|2|U|),而总空间复杂度为O(|U|)。(3)在研究不完备决策表时,通常是用容差关系建立模型,但是容差关系在对象划分上不够精准。通过研究限制容差关系发现利用它划分的限制容差类更加精细与合理,可以方便核属性的计算。所以构造出基于限制容差关系的二进制差别矩阵,通过该矩阵来求核。该方法的时间复杂度O(|C||U|2),空间复杂度降到O(|C||U||Upos|)。
其他文献
图像特征提取与匹配是计算机视觉领域的基础研究问题,也是该领域的研究难题。在过去的数十年内,该问题持续是热点研究问题,国内外很多专家学者相继提出了很多特征提取与匹配
随着信息技术的高速发展,人们的日常生活中涌现了大量的科技产品,而人们对于生活品质的更高追求使得对于科技产品的体验提出了更高要求。Java Card技术自诞生起便凭借其自身
现在主流的CAD建模方法是参数化特征建模,但参数化特征建模技术对复杂模型的编辑效率低下,且来自于操作历史的约束也限制了模型编辑的灵活性。近年来兴起的直接建模技术通过直
目前,大部分企业都将IT基础设施进行集中监控,以便统一管理调度,提升业务应用的性能。针对监控到的海量事件,如何有效地将它们融合在一起加以利用,获取更有价值的信息,是进行
科学技术的不断发展使天文学进入了全波段巡天时代,同时天文观测得到的各个波段的数据迅速增长。随着我国LAMOST项目开始正式巡天,在巡天过程中将会逐渐发布海量的光谱数据,
视频内目标跟踪作为计算机视觉领域中的基本问题之一,已经广泛地应用在人们生活的各个领域。影响视频目标跟踪的因素有很多,比如光照、遮挡或者运动状态的变化等,因此开发一种高
大爆炸算法(Big Bang-Big Crunch, BB-BC),是由土耳其伊斯坦布尔科技大学的Osman K. Erol*和Ibrahim Eksin于2006年提出的一种新的群体智能优化算法,该算法思想来源于了宇宙
云计算作为海量数据处理的新型计算模式被提出之后,其发展极为迅速。它将大量的计算机通过网络连接构成一个集群,用户通过集群的一台PC机就能够获得整个集群内所有的资源,如
随着智能移动终端设备在普通大众生活中的普及,以移动终端为平台的环境星遥感数据共享受到越来越多的关注。环境星遥感产品数据由遥感算法和遥感影像数据经过遥感产品生产过程产生,在传统的遥感数据共享方式中,这一动态生产过程发生在用户提交共享请求之前,这种方式带来的问题是用户请求共享的产品数据缺少自主选择性及获得的产品数据类型有限。针对该问题,论文采用遥感数据处理系统作为遥感产品数据生产的支撑平台,提出一种数
水资源是生命赖以生存和社会经济建设的必要条件,在当前水资源利用过程中存在的问题有:(1)水资源短缺是水资源管理中面临的首要问题,明确缺水地区的缺水类型,有利于针对不同短缺