关联规则增量更新算法研究与应用

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:yourwp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘通过从大量数据中提取感兴趣的知识、规律或更高层次的信息,可以有效的解决“数据爆炸而信息匮乏”问题。关联规则是数据挖掘领域中一个重要的研究课题,主要描述事务数据库中不同项集之间的有趣关联或相互关系,在电信业务、零售业交易、环境监测、工业生产、互联网服务等领域中应用广泛。随着高速数据获取、网络通信、数据管理等技术的发展,时效性高、动态变化的数据不断聚集,隐藏在其中的关联规则也必然会发生变化。及时高效的关联规则更新对于趋势分析、指挥调度、辅助决策、信息推荐等具有重要的应用价值。   现有的关联规则更新算法大多致力于解决增量更新本身,但很少同时考虑更新时机,不适于对实时应用中频繁更新的数据进行有效处理。针对此问题,本文提出了一种与时机判定相结合的关联规则增量更新算法。该算法在改进增量更新方法的同时,兼顾对更新时机的判定。在关联规则时机判定阶段,根据关联规则差异度确定关联规则更新时机。在关联规则增量更新阶段,计算含有非空子集个数之和最多的频繁项集,找出在更新数据集中仍然频繁的项集,根据Apriori性质,采用增强的剪枝策略修剪候选项集,减少需要计算的候选项集,加速关联规则的更新过程。   为验证与时机判定相结合的关联规则增量更新算法的有效性,本文主要从算法的执行时间和计算过程中需要存储的候选项集数量两方面进行测试。算法分析和实验结果表明,通过对更新时机的及时判定和候选项集的有效剪枝,关联规则的更新效率得以提高。该算法有效应用于基于关联规则的网上购物推荐系统中,可发现关联规则能够随系统中交易数据的变化而及时更新。
其他文献
近年由于图形技术的迅速发展,引导了许多不同数据集的数字对象的创新。这些对象可以被用来分析,变形迁移或者比较等。在多数情况下,我们在将一对或者一组数字对象用于这些领域之
MrBayes是一款在生物信息学(Bioinformatics)领域被广泛使用的软件。它使用Metropolis coupled Markov chain Monte Carlo(MC3)算法进行贝叶斯系统发育推断(Bayesian phyloge
生物识别是身份识别中的一种重要的技术手段,目前已经受到人们普遍关注。常用的生物识别技术主要有指纹识别,人脸识别,虹膜识别,掌纹识别等,其中指纹识别是最常用的识别技术,但它对
近年来,卫星系统技术日趋成熟,卫星系统的运行管理越发变得重要,而卫星系统运行管理的最主要任务是在地面站与卫星间进行数据通信的调度。对卫星网络的通信调度问题我们主要
随着XML数据被越来越广泛的在互联网上应用,如何对XML数据进行高效管理成为一个研究的热点,将XML数据引擎无缝集成到关系数据库是一种既可沿用关系数据库成熟理论、技术同时又
视频分割是计算机视觉领域的一个很重要的问题,在影视娱乐领域有着很广泛的应用,如电影的后期制作。近年来通过多媒体技术的发展趋势可以看到,三维立体视频将是未来视频的主
近十多年来,越来越多的数理和计算机科学家认识到了二十一世纪复杂系统研究的重要性并作出了有益的尝试,社会系统是复杂系统之一,是该领域的一项重要研究。人类的科学活动,如科学
生物信息学是用计算机来处理和研究生物信息的一门新兴学科,随着生物信息学迅速发展,各种数据库不断涌现,并各具特色。对平均十四个月翻一番的基因序列数据进行存储管理和比
操作系统是计算机系统中最基本、最重要的软件,其安全性和可靠性是计算机系统提供可信计算的首要条件,也是其它应用软件正常运行的基本保障。但是操作系统内核结构复杂、规模
近年来,随着信息服务、移动通信、互联网、数字存储等技术的迅速发展,移动对象的信息处理和知识获取成为了人们研究和关注的热点,与此同时个体活动行为的研究也越来越受到重视。