【摘 要】
:
为解决传统关联规则挖掘算法在大数据环境下运行效率较低的问题,基于频繁模式增长(FP-growth)算法,提出一种面向大数据的并行关联规则增量更新算法。利用MapReduce编程模型与云
论文部分内容阅读
为解决传统关联规则挖掘算法在大数据环境下运行效率较低的问题,基于频繁模式增长(FP-growth)算法,提出一种面向大数据的并行关联规则增量更新算法。利用MapReduce编程模型与云计算平台,对FP-growth算法各步骤进行并行化处理。在增量更新挖掘过程中,使用已有的频繁项集和1-项集对新增事务集构建频繁模式树,通过扫描原始事务数据库完成频繁项集的更新。实验结果表明,与传统关联规则挖掘算法相比,该算法具有更高的挖掘效率和扩展性,适用于海量数据的关联规则增量挖掘。
其他文献
广东要率先实现代化,自主创新是关键。广东虽然在经济改革过程中取得巨大的成就,但企业的创新、特别是自主创新在全面并没有优势。如果在未来的时期加强企业,特别是中小企业的自
国际惯例不仅是商界人士关注的焦点,同时也是学者研究的热点。但是对国际惯例的概念、国际惯例与国际习惯的关系等问题学者之间在认识上仍然存在一定的分歧,本文试图对其做进一
2017年5月15日,全国职业院校技能大赛天津主赛区各项比赛圆满落幕。10年来,大赛为学生搭建了切磋技艺、一显身手的平台,一批批优秀的工匠能手脱颖而出。10年来,赛项设置不断
目的探讨治疗老年股骨颈骨折的最佳手术方式。方法收治老年股骨颈骨折126例,其中内固定治疗29例,FHR44例,THA53例。结果内固定组手术时间最短、术中出血量最少,FHR组次之,THA
通过论述餐饮企业标志的现状及存在问题,以餐饮企业标志的定义为基础,阐述了餐饮标志主题定位的基本思路。在此基础上根据餐饮企业的特点,通过实例分析了以企业文化、行业特