基于粗糙集理论的增量算法的研究和应用

来源 :福州大学 | 被引量 : 3次 | 上传用户:BBQChris
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术的发展和应用,社会各部门积累了大量的数据,而且这些数据每一天都在增加。数据挖掘是发现这些数据背后隐藏的知识的有效手段,但是,如果在数据库更新之后都要对全部数据进行重新挖掘,需要消耗大量的资源,这导致对增量挖掘算法的迫切需求。把增量算法与数据库的更新结合在一起,渐增地进行知识的更新、修正和加强先前业已发现的知识,这样可以不必重新挖掘全部数据。粗糙集理论是数据挖掘的方法之一,它是处理模糊和不确定知识的一种数学工具, 已在人工智能与知识发现, 模式识别与分类, 故障检测等方面得到了较好应用。但是,目前基于粗糙集理论提出的数据挖掘算法主要都是针对静态数据集。考虑到实际应用的需求和粗糙集理论的现状,本文主要对粗糙集理论的增量算法进行研究。首先,介绍了两种典型的粗糙集理论的增量算法,分析其中的优点和缺点,指出了他们所存在的理论上的缺陷。然后,通过对ASRAI算法的介绍与分析,举出ASRAI算法的反例,提出增量算法1以用于克服ASRAI算法存在的缺点。实例结果表明它可以有效地处理本文中提出的反例。最后,引入了Shan算法,经分析表明Shan算法与ASRAI算法是等价的。通过对Shan算法的研究发现:当添加某一类新记录时,运用Shan算法得出的结果可能出错,而且这种错误是无法克服的,只能运用静态算法对数据集进行重新计算。通过以上的分析表明增量算法1只能处理部分的反例,为此提出了增量算法2,实验结果表明改进效果良好。与此同时开发了一套粗糙集理论的系统原型,包含了部分的粗糙集理论的算法,并对本文提出的增量算法2进行了实验分析。
其他文献
现今互联网正日益高速发展,当前的网络架构逐渐遇到发展瓶颈。尤其是随着网络虚拟化、云计算的大规模兴起,现存的网络设备及相关协议正成为阻碍其发展的因素。由于网络流量达