大数据环境下基于Hadoop框架的改进Apriori挖掘算法

来源 :机床与液压 | 被引量 : 0次 | 上传用户:hnsushiheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对Hadoop框架下的用户行为大数据挖掘效率问题,提出了一种改进的关联规则Apriori挖掘算法。该算法首先实现了Hadoop框架下的项集分类建模。然后通过传统关联规则Apriori算法的挖掘步骤分析,对候选项目集的生成方式进行了改进,并结合标志位信息实现无用事务去除,有效压缩了事务和项目的数量,从而缩短了任务处理时间。在具体实现过程中对改进Apriori算法流程进行了Map Reduce处理。仿真实验表明:相比于传统Apriori算法,改进后的Apriori挖掘算法具有更高的执行效率。
其他文献
根据河南省教育厅统一部署,第十届河南省高职院校技能大赛暨2017年全国职业院校技能大赛高职组河南选拔赛于2017年3月25日在全省21所高职院校陆续拉开帷幕。在河南选拔赛中胜
高校内部会计控制是高校为保护财产的安全与完整,提高会计信息质量,贯彻执行国家的法律法规而制定的一系列互相联系、互相制约的管理制度。本文首先对高校内部会计控制的现状进
随着《小企业会计准则》在小企业范围内实施,从小企业规模小、业务量少,且简单易行的实践特点中,对照《小企业会计准则》与《企业所得税法》的相关规定,在资产、收入、成本费
为了探讨癌基因Ezrin蛋白表达在肺鳞癌中的预后意义,应用免疫组化染色检测了96例肺鳞癌及其癌旁正常肺组织中Ezrin蛋白的表达,并结合临床生物学指标及生存时间进行统计学分析
为缩短传统叶片制造过程中喷涂工艺所花的时间,设计一种单导轨双悬臂式单枪喷涂机器人,并制定一种针对大型复杂风力机叶片进行机器人自动喷涂的方案。先建立所喷涂叶片的三维
十一届三中全会以来,物资经济理论作为流通经济理论的重要组成部分取得巨大发展,它通过对中国特色的社会主义制度下,生产资料(主要指商品)在一个生产过程的结点到另一个与之相
分析了塑性混凝土的性能及水胶比、水泥用量、膨润土、黏土、用沙量等因素对其物理力学性能的影响,探讨了塑性混凝土在围堰工程、坝基混凝土防渗墙、病险水库除险加固等水利
通过对高校财务风险特征的分析,根据财务风险评价指标体系的原则,从偿债能力、运营绩效能力、成长能力三个方面来构建高校财务风险评价指标体系,以反映高校总体的财务风险状
针对锦屏二级水电站引水隧洞末端的4个调压井,通过掺入不同掺量的PVA纤维进行混凝土的开裂性能试验研究,得出PVA混凝土最佳纤维掺量为0.9%的结果。在此基础上,探讨了PVA纤维
中国未来的城镇化道路转型发展显示更加显著的位置,它的战略目标是把中国成功推向高收入国家的决定性步骤。新阶段中国的城镇化道路将会是一条艰难的转型之路,增长动力的转型升