PFPonCanTree:一种基于MapReduce的并行频繁模式增量挖掘算法

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:zxtx001209
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
频繁模式挖掘是最重要的数据挖掘任务之一,传统的频繁模式挖掘算法是以“批处理”方式执行的,即一次性对所有数据进行挖掘,无法满足不断增长的大数据挖掘的需要。MapReduce是一种流行的并行计算模式,在并行数据挖掘领域已得到了广泛的应用。将传统频繁模式增量挖掘算法CanTree向MapReduce计算模型进行了迁移,实现了并行的频繁模式增量挖掘。实验结果表明,提出的算法实现了较好的负载均衡,执行效率有明显提升。
其他文献
目的 探讨盐酸氨溴索气管内滴入在新生儿机械通气中的临床应用疗效。方法 将40例患儿随机分成2组,对照组采用气管内滴人生理盐水,观察组采取气管内滴入稀释的盐酸氨溴索。结果
对26株蜡状芽胞杆菌群菌株进行了肠毒素基因及其它病原相关因子的检测.PCR结果表明,17株蜡状芽胞杆菌群菌株中含有病原调控因子plcR的同源序列.采用3组溶血肠毒素hbl基因和3
以1999年建植的5个不同禾草组合混作草地为对象,研究连续两年不同施氮量75kg/hm^2(N1),150kg/hm^2(N2),225kg/hm^2(N3)和0kg/hm^2(CK)对草地生产力的提升及群落特征的综合影响.结果表
直流电压稳定是关系到电压源型直流输电系统可靠运行的关键问题之一。文中首先分析了在电压源型直流输电系统中直接电流控制和直流电压偏差控制的工作原理,然后提出了在电压
现代电子对抗中,监听者在链路层获得的一般是未知比特数据流,在未知帧格式的情况下,正确地从中切割出完整帧是一个难点,为此提出一种基于数据挖掘的比特流切割算法.首先分析了协议
重点介绍铁路客车自动上水工作原理及客车自动上水系统的试验与效果。 Focus on the introduction of the principle of automatic bus passenger water and bus test and e
旨在研究纯化的大豆球蛋白对离体培养的仔猪空肠上皮细胞(IPEC细胞)通透性以及对细胞间紧密连接蛋白Occludin mRNA表达的影响。将不同浓度的大豆球蛋白(0~5.0mg·mL-1)与肠上
人力资源计分卡,是用以评价人力资源结构对公司战略性影响的评估模型。不同于ROI分析,人力资源计分卡阐述了一种理论,即人力资源如何为整个公司创造价值。人力资源计分卡之中
行政人与其他人一样生活在复杂的社会关系下并承担着不同的角色,每一种角色都附带着一系列的义务与利益规定。角色冲突、利益冲突甚至是道德冲突产生的伦理困境,使得行政人经
胃癌是消化系统最常见的恶性肿瘤之一,死亡率较高,在我国占恶性肿瘤死亡总体的24%,多以手术综合治疗为主。早期胃癌行根治术后九成患者可获得5年以上生存率,但是由于多种原因,大多