基于Hadoop的并行朴素贝叶斯分类算法

来源 :玉林师范学院学报 | 被引量 : 0次 | 上传用户:rliang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
串行的朴素贝叶斯分类算法对大数据分类需较长的执行时间,针对这个问题,设计了一种基于Hadoop的并行朴素贝叶斯分类算法.并行算法使用一个HapReduce任务对训练子集并行计算各个类别的先验概率和每个属性值的条件概率,从而实现了分类模型的构造,使用一个MapReduce任务对测试子集并行计算被正确分类的样本数,输出分类器的分类准确率.使用大数据集测试了串行算法与并行算法的运行时间,结果表明并行算法具有更高的执行效率.
其他文献
通过对董哥洞石笋进行高精度的TIMS-U系测年和C、O同位素分析,建立了贵州省荔波地区15470a以来高分辨率的古气候变化时间序列。研究结果表明,荔波地区15470a以来石笋记录的冷暖
当代美国著名的女性主义科学哲学家唐娜·哈拉维以“赛博格”理论而蜚声学界。哈拉维的“赛博格”理论,展开了一场关于女性与科技的对话,通过“赛博格”的女性主义隐喻揭
重点报道了藏北高原双湖地区早侏罗世海相油页岩和可可西里地区中新世陆相油页岩生物标志化合物组合差异。在两套油页岩中均检出丰富的正构烷烃、类异戊二烯烷烃、萜类化合物
随着社会经济和科学技术的不断发展,我国水利工程建设越来越受到社会的广泛关注。本文从分析水利工程中灌浆技术的应用价值出发,指出了灌浆技术在水利施工中存在的问题,最后
高岭石的表面荷电性、溶解及其对 Cu2+、 Pb2+的吸附等实验结果表明, 高岭石的零净质子电荷点 pHPZNPC=5.2,但端面 >AlOH的 pHPZNPC在 6.5~ 7.0之间,而 >SiOH的 pHPZNPC < 2.3
随着科学技术的发展,建筑行业也在进行着高速的发展。人们的生活生产水平也显著提高,深基坑支护施工技术在大型的建筑物中应用的非常普遍,比如说地下室的工程施工,而现在随着
我公司余热电站燃煤制备生产线中的煤矸石输送提升机采用的是板链式提升机。输送2-30mm粒度的煤矸石物料,输送高度30m,输送能力150t/h。其传动机构采用链式传动(图1),并配有摆线针
前人工作认为北大别榴辉岩在榴辉岩相变质后,经历了麻粒岩相退变质作用,因此获得的Sm-Nd矿物等时线年龄代表了麻粒岩相变质时代.本文对北大别安徽洪庙百丈岩榴辉岩相岩石(辉
下扬子地区溧水盆地晚中生代龙王山组基性火山岩属高钾钙碱性-钾玄岩系列,具有低MgO(3.16%~4.97%)和相容元素含量(如Cr11~34μg/g、Ni 9~27 μg/g),强烈富集大离子亲石元素(Ba/N
鄂尔多斯盆地上古生界气藏的研究已有较多的报道,但盆地抬升过程中源岩是否生气以及生气作用结束的时间等问题还存在争论或认识不清.本研究通过封闭体系的模拟实验,利用生烃