基于快速挖掘的增量更新AAIU算法的研究

来源 :中南民族大学 | 被引量 : 0次 | 上传用户:wychao1014
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
挖掘关联规则及规则的更新是数据挖掘领域的一个重要研究热点之一。目前已经提出了许多用于高效地发现大规模数据库中关联规则的算法,这些算法都有各自的特点。基于不同的关联规则发现算法有不同的规则增量更新算法。 深入研究了挖掘关联规则的经典算法Apriori以及常用的几种增量关联规则的挖掘算法FUP、IUA,分析了它们的执行效率,指出了其效率低下的主要原因是由于多次迭代扫描、每次迭代产生数目更大的频繁集造成的。 介绍了一种快速关联规则发现算法--QAIS算法,它通过对初始数据库的一次扫描就得到数据的项集,再对该项集一次扫描就可得出频繁项集,这样即大大减少了扫描数据库的次数同时降低了二次扫描规模。指出了QAIS算法在项集生成方面存在不足:首先是该算法在生成项集及获取项集支持度方面效率较低;其次该算法虽然提出了整合项集的概念,但却没有明确提出使用什么样的方法去实现其功能。针对QAIS算法的不足,论文在项集生成方法上作出改进,提出了NewQAIS算法这一新的解决的方案:使用基于链表的整合项集数据结构,节约了内存空间,同时对交易非空子集生成方法进行改善,降低了项目子集生成的复杂度。相对基于QAIS的增量更新算法AIU,这里提出了基于NEWQAIS的增量算法AAIU,该算法屏弃了其他更新算法要逐一计算项集支持度来判断项集是不是属于频繁集的做法,通过对原始、新增数据库的扫描得到两个整合项集,并将其分为频繁和非频繁两块,再进行匹配批处理,更高效率的实现了频繁集的发现。 给出了AAIU算法,并将其与Apriori算法的进行测试比较,得出结论,从而进一步证明了该算法的高效性以及挖掘的充分性。
其他文献
随着网络和个人计算机的发展,特别是P2P技术的发展,数字内容可以很容易地通过网络进行传播,盗版现象日益严重。于是,数字版权保护(Digital Rights Management, DRM)技术便应
IEEE 802.11a无线局域网标准是计算机网络与无线通信技术的融合,它最初定位在家庭和办公室等室内环境的无线宽带网络服务。但是随着技术的发展,已经逐步应用到“无线热区”甚至
随着因特网的发展和后PC时代的到来,嵌入式系统己经成为计算机技术领域的一个新的研究热点。嵌入式系统是一个复杂的软硬件集成系统,如何来学习嵌入式系统是一个重要的课题。由
为了提高土木工程的质量、保护量测技术人员的安全、减少工程费用、提供同步测量的可能性,研发了一套土木工程质量远程监测系统。系统主要由前端数据采集子系统和后台数据处
虚拟人足球比赛仿真系统是虚拟人技术和人工智能的集中体现,同时还涉及计算机图形学、虚拟现实、运动学与动力学、多功能感知、认知心理学等多个学科,是一个非常典型的复杂系统
目前,数据已作为企业重要、可共享的资产,成为信息化建设的重点和基石。然而,大多数部门都独立地进行本部门或本企业的信息系统的设计,而不与其它企业或部门进行交流,形成了
在模式识别领域,人脸识别已经成为研究热点,不仅具有很高的研究价值,还有广阔的应用前景。本文的研究工作包括人脸特征定位和人脸识别两部分。人脸特征定位在人脸识别应用中起着
20世纪90年代以来,生命科学研究取得了突破性的进展,随着人类基因组计划的开展与现代生物技术的发展,人类积累的大量的生物信息数据为揭开生命奥秘提供了数据基础。而怎样从
随着计算机技术的发展,软件和软件系统在生产生活中的应用越来越广泛。除了微型计算机中的应用软件外,在工业制造、交通运输乃至军事领域中也拥有了规模庞大的软件系统。在大型
学位