一种基于MapReduce的频繁项集挖掘算法

来源 :软件导刊 | 被引量 : 0次 | 上传用户:dqhzzy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,针对Apriori算法和FP-Growth算法在挖掘海量规模数据频繁项集时,存在内存不足、计算效率低等问题,提出一种Aggregating_FP算法。该算法结合MapReduce并行计算框架与FP-Growth算法,实现频繁项集的并行挖掘,对每个项进行规约合并处理,仅输出包含该项的前K个频繁项集,提高了海量数据决策价值的有效性。在Hadoop分布式计算平台上对多组规模不同的数据集进行测试。实验结果表明,该算法适合大规模数据的分析和处理,具有较好的可扩展性。
其他文献
金融是现代经济的核心,现代经济是金融经济。在金融经济时代,金融安全已成为经济发展的基本前提和重要保障。它不仅关系着一国的经济安全,还关系着一国的政治安全。防范、控制和
目的评价顺式阿曲库铵及琥珀胆碱三种不同给药方法在显微支撑喉镜下喉手术中的麻醉效果比较。方法择期显微支撑喉镜下喉手术患者60例,随机分成三组:顺式阿曲库铵组(A组,n=20)、顺
本文围绕电力调度系统采用IEC 60870-5-104远动规约进行网络访问这一题目进行研究。分析了这种新型规约的机制,解决了104远动模块在CC-2000调度自动化系统中的实现问题。并在
采煤塌陷引起的土壤环境因子的变化对矿区植物生长的影响越来越受到人们的关注,快速叶绿素荧光诱导动力学分析技术被称为植物受胁迫状态的有效探针,能够快速获取胁迫下光系统
乡村经济社会发展是一国经济发展的重要组成部分,国家的发展离不开乡村经济社会的发展,随着乡村发展实践与研究的不断深入,关于乡村经济社会发展社会治理模式值得我们去研究
介绍了用电导法评价反渗透阻垢剂性能的原理,并以聚环氧琥珀酸(PESA)阻垢剂为例,进行了阻垢性能评价。通过分析相对过饱和度曲线,得到最佳投药量,并与碳酸钙沉积法(GB/T16632
随着信息技术的发展,微文化逐渐进入我们大众的生活,网络上的微博、微信都在以惊人的速度发展和扩大。除了微博、微信之外,微课也成为了当代"微"文化的重要传播途径。微课的
项目管理是实施建筑工程管理的主要手段,项目成本控制又是建筑工程项目管理中“三大目标控制”之一。本文以实现建筑工程成本的有效控制为目的,提出了建筑工程项目管理“广义成
本文对20世纪我国现代汉语副词研究所走过的历程作了简要的回顾。回顾分为两个部分:研究方法的回顾;组合、聚合与个案研究的回顾。调查结果显示,组合与聚合相结合将是今后副
代谢综合征是一个多症候群的综合征,其病因主要是胰岛素抵抗和肥胖。代谢综合征血脂异常主要表现为富含甘油三酯的脂蛋白升高、高密度脂蛋白胆固醇降低和小而密低密度脂蛋白