基于分布式的频繁闭合模式挖掘算法研究

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:mynameiscaohaoxiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则挖掘是数据挖掘研究中的热点问题之一,其目的是发现数据库中数据项之间存在的潜在联系。关联规则挖掘的重点任务是频繁模式挖掘。然而,由于频繁模式挖掘的复杂性,业界提出了频繁闭合模式挖掘问题。频繁闭合模式可以唯一地确定所有频繁模式完全集以及它们的准确支持度,且其规模远远小于频繁模式。在单处理机上的频繁闭合模式挖掘算法研究方面,人们已经取得了许多成果。但随着分布式环境的日益普遍,使得传统串行算法的挖掘技术已无法解决分布式下的挖掘问题,因此,研究高性能的分布式频繁闭合模式挖掘算法显得尤为重要。本文在对典型关联规则挖掘算法进行较深入研究的基础上,将分布式思想引入关联规则挖掘中,提出了两种分布式频繁闭合模式挖掘算法,主要内容有以下两部分:第一部分提出了一种基于分布式的频繁闭合模式挖掘算法-PFCI_Miner。算法采用任务分布的主从方式,其中主处理器通过发送文中提出的前缀路径表(PrePthx)将挖掘任务合理划分,而从处理器借助提出的存储树(Trac-tree)挖掘局部频繁闭合模式,最后由主处理器挖掘出全局频繁闭合模式集。另外,采用星形的拓扑结构,使数据通信只存在于主处理器与从处理器之间,而各从处理器之间无数据通信且不需要同步。实验结果表明,PFCI_Miner算法具有较好的效率。第二部分针对数据流及分布式算法的特点,提出了一种数据流下的分布式频繁闭合模式挖掘算法DSFC_Miner。该算法采用分段思想,挖掘每个数据流分段的临界频繁闭合模式,并创建相应的局部FCI_DS树保存临界频繁闭合模式。最后通过合并局部FCI_DS树,在允许误差范围内挖掘得到当前数据流中的频繁闭合模式集。实验结果表明该算法是可行的。
其他文献
随着人们生活水平的提高与生活节奏的加快,在电子商务的快速发展背景下,电子彩票已经被越来越多的人所接受,通过网络,手机等方式购买电子彩票是一个大的趋势。目前彩票种类分
信息技术的快速发展使得人类与计算机的关系日益密切,智能人机交互已成为人工智能领域内的研究热点之一。情感识别作为智能人机交互的关键技术之一,在其中也扮演着重要角色,
车牌识别系统VLPR (Vehicle License Plate Recognition)是现代智能交通系统ITS (Intelligent Transportation System)中的重要组成部分,在违章车辆抓拍、停车自动收费、交通
人脸识别系统中,多种关键技术会对最后识别结果产生影响,而关键技术中的光照在人脸识别中是实现人脸识别常态化最大的一个障碍;同样人脸识别算法是人脸识别中最重要的一个环
随着计算机网络技术的迅速发展,诸如网络流媒体等技术在网络上应用越来越多,这都为组播通信提供了更好的发展空间。组播技术是一种比较理想的、用于实现群组通信的网间通信技
模型检测是一种形式化验证方法,目前已经得到了广泛的发展和应用。本文给出的是一种基于命题投影时序逻辑(Propositional Projection Temporal Logic,PPTL)的模型检测器的改进和
滑阀组件通常是将工艺不同的孔轴零件按照一定的配套规则进行组合而成。本文研究的滑阀组件将用于航空飞机,基于安全性考虑,孔轴零件的测量值和间隙值均精确至万分位,同时确
普适计算是一种全新的计算模式,其致力于将由通信和计算构成的信息空间与人们工作生活的物理空间融为一体,支持用户“随时随地”并且“透明”地获取符合其个性化需求的信息服
下一代的互联网数据与服务核心必然是云计算。它被使用在公共服务和按需计算服务领域。云计算不是一个全新的技术,而是在应用和服务创新中派生出来的,多租户就是云计算核心技
如今大数据产业的发展对全球经济发展方式的转变、人类生活水平的提高和国家综合能力的增强起到显著推动作用。为促进该产业又好又快的发展,首要任务就是开放共享数据,但企业