基于Spark的Apriori算法的改进

来源 :东北师大学报(自然科学版) | 被引量 : 0次 | 上传用户:asnbgq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于Spark大数据框架,将传统Apriori算法进行并行化处理,提出了一种改进的并行化AMRDD算法,使Apriori算法能够适用于大数据关联规则的挖掘.该算法利用Spark基于内存计算的抽象对象存储频繁项集,通过引入矩阵概念减少扫描事务数据库的次数,应用局部剪枝和全局剪枝方法缩减生成候选频繁项集的数量.通过搭建Spark平台实现该算法,并与传统Apriori算法和基于Hadoop的Apriori算法进行性能上的比较.结果表明,该算法能够较大程度地提高大数据关联规则挖掘的效率.
其他文献
<正>《真想变成大大的荷叶》是苏教版小学语文二年级下册的一首儿童诗,展现了孩子们在夏天的美好遐想,洋溢着浓浓的童真童趣。二年级的学生天真浪漫、富有想象,基于这一学情,
运动疗法是一种防治颈椎病的有效手段,值得进一步研究和推广。本文简要介绍了主动运动疗法作用于颈椎病的机制,以及该法在颈椎病中的临床应用。最后,对主动运动疗法干预颈椎
目的观察拉米夫定联合安络化纤丸治疗乙肝肝硬化的临床效果。方法选取2013年8月~2014年11月唐山市传染病医院收治的乙肝肝硬化患者86例作为研究对象,按随机数字表法将其分为
<正>"您瞧,剃完头多精神,一会儿给您放放睡。""什么是‘放睡’?""这是老词儿,就是掌柜要用五花锤按摩敲打,每下都要敲在穴位上,把你心里的火啊毒啊全都给释放出来。老主顾、
期刊
合成了水杨醛缩苯胺类、邻羟基苯乙酮缩苯胺类两个系列Schiff碱化合物共12个,系统研究了其IR、~1HNMR波谱性质。在1~HNMR谱中,首次得出两个系列Schiff碱化合物的羟基质子的化学位移值都与N-苯基上取代基的Hammett常
<正>儿童视角、儿童立场、儿童课堂,这些都不是新鲜的话题,但在当下却有着非常实际的意义。这些年,语文教学与这个时代一样,发展迅速,而且流派纷呈,令人眼花缭乱。这应该是可
毫无疑问,NBA是众多篮球运动员梦想的天堂,是球迷一饱眼福、享受篮球的乐园。随着社会发展,NBA也在不断改变,无论是从包装还是从运营,NBA都是其他国家学习的对象。因此NBA全
<正>面对高考的压力,高三学生不同程度地存在着焦虑、情绪波动、患得患失、心理脆弱等一系列心理问题。如何使学生保持健康的心态,变压力为动力,在高考中正常发挥水平,是班主
我国旅游业快速发展,音乐已经成为重要的人文旅游资源。这就对旅游专业学生提出了更新的要求,不仅要求学生具备全面的文化知识和专业技能,还要有一定的艺术修养,才能成为全方
当今世界羽毛球运动水平的发展已进入一个新的阶段,要求优秀的羽毛球运动员不但要有娴熟的技术、灵活多变的战术,更要有良好的身体素质基础作保证。科学训练是运动员成功与否