基于MapReduce的JP算法设计与实现

来源 :计算机工程 | 被引量 : 0次 | 上传用户:jiu1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对大规模文本聚类分析所面临的海量、高维、稀疏等难题,提出一种基于云计算的海量文本聚类解决方案。选择经典聚类算法Jarvis-Patrick(JP)作为案例,采用云计算平台的MapReduce编程模型对JP聚类算法进行并行化改造,利用搜狗实验室提供的语料库在Hadoop平台上进行实验验证。实验结果表明,JP算法并行化改造可行,且相对于单节点环境,该算法在处理大规模文本数据时具有更好的时间性能。
其他文献
针对神经网络结构与参数并行优化问题,提出一种基于动态多群体差分进化算法的前向神经网络设计方法。采用分层递阶结构原理构造算法个体,根据控制基因信息将个体分成不同的动
目的:探讨护理干预在预防新生儿皮肤抓伤及管道脱落中的效果。方法:选取我院产科2015年1月-12月之间收治的120例新生儿,随机将其分为对照组和实验组,对照组新生儿接受常规护理,实
为实现对高速公路隧道照明系统的节能控制,提出基于云模型的车辆速度与位置估计方法。结合正向云与逆向云算法,对车辆通过线圈时的脉冲波形数据进行处理,获得均速估计值。将车速
目前测定水中钙的方法主要有乙二胺四乙酸二钠滴定法,火焰原子吸收分光光度法。其中容量分析法是经典法,操作简单,但对终点的判别总有个体差异。本文参照文献[1]的方法,利用邻-甲酚酞
为保护舰艇舱内海军官兵的身体健康,在舰艇舱内利用电晕放电以产生人工电气候,并对 红细胞计数,血红蛋白含量,肺活量,心率及空气满意度进行测定并进行模糊数学的综合评价,结果表明
LT码的BP译码算法复杂度较高,在译码时由于Tanner图短环的出现易产生震荡效应。为此,提出一种软比特域迭代译码算法。将双曲正切函数进行变换和量化处理,得到(-1,1)区间的软比特域,