基于粗糙集理论的分类规则挖掘

来源 :安徽大学 | 被引量 : 0次 | 上传用户:kzyzf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术的发展和信息时代的来临各行各业都积累了大量的数据,数据库中存储的数据量急剧增加。因此,为了提高工作效率和生活质量,人们必须获取蕴藏在其中的有价值的信息。为了达到这个目的,人们开始致力于从数据库中发现知识的研究。然而,众所周知,数据库中往往存在冗余数据、缺失数据、不确定的数据和不一致的数据等诸多情况,这些数据成了发现知识的一大障碍。粗糙集理论是1982年Pawlak提出,经历了20多年的发展,已经在理论和应用上取得了丰硕的成果。它不依赖于数据集之外的附加信息,是处理含有噪声、不精确、不完整数据的有力工具。许多知识发现技术仅仅适用于精确集,不适用于粗糙集,而现实中粗糙集是普遍存在的现象,因此基于粗糙集的知识发现模型在信息系统的研究领域具有重要意义。本文首先介绍了知识发现的历史、现状和可能的发展方向,并回顾了它的主要方法和技术。然后,论文对粗糙集理论进行了介绍,并对数据挖掘中的各环节运用粗糙集理论的方法进行了分析。接着论文研究了在数据缺失或信息不完备的情况下基于粗糙集理论进行分类规则的挖掘。结合前人的研究成果提出一种从不完备信息系统中提取有用的关系和规则的综合性方法。另外从粗糙集和决策树两种方法具有的优势互补性出发,提出了一种基于粗糙集的决策树生成方法。通过例子和实验,说明这两个方法的有效性。
其他文献
计算机支持的协同设计是并行工程的重要组成部分,是21世纪的生产模式,其重要性在于使不同地点的设计人员、施工人员和用户能同步或异步地参与协作设计工作,从而加快设计进度和提
随着Internet技术和网络业务的飞速发展,用户对网络资源的需求空前增长,网络也变得越来越复杂。越来越多的网络应用程序需要了解网络延迟、带宽、吞吐率等网络性能参数,以支持不
网络技术的迅速发展和J2EE平台的广泛应用,基于B/S的多层WEB体系结构逐渐发展起来,多层WEB应用的开发已经成为主流。但是,多层WEB体系结构的设计中,仍然存在程序可重用度低、维护
儿童计划免疫工作手续繁琐,工作量大,不易及时汇总分析。现在全国有不少地方在进行信息化建设来解决上述问题。由于经济条件、网络覆盖等因素影响,目前的儿童计划免疫大多使用单
在没有软件源代码的情况下,为了对其增加功能或修正错误,需要在机器指令级别上对软件进行修改,将机器代码嵌入到宿主软件中。这就是软件或代码嵌入。软件嵌入由来已久,文件补丁、
当今,人类已经进入了网络时代。然而,人们在得益于信息革命带来的巨大机遇的同时,也不得不面对信息安全问题的严峻考验。入侵检测技术作为确保计算机网络信息安全的一个重要手段
随着信息技术的迅速发展,网络信息不断膨胀。如何让网络信息更好地为人类服务,已成为未来几年的一个研究热点。一方面是人们对快速、准确而全面获取信息的渴望,而另一方面却是网
计算机作为互联网的一种重要信息终端,是目前人们获取网络信息的主要工具。然而,由于传统的上网方式限制了上网人数,互联网的访问模式逐渐从单一访问方式向多种用户终端发展。近
在本文中,我们将考虑如下三个在网络设计中抽象出来的优化问题,一是内点带权最小生成树问题,二是多商品设备选址问题,三是多层次设备选址问题。本文中考虑的这三个问题的若干版本
在网络数据交换日益增多的今天,XML作为一种半结构化数据以其简单易标记和跨平台等优点被越来越广泛的应用到数据存储和数据传输领域。XML数据库是一项在最近几年发展起来的新