云计算平台中分布式Hadoop数据挖掘关键技术研究

来源 :机床与液压 | 被引量 : 0次 | 上传用户:kjc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
云计算环境下的大数据特征挖掘是大数据统计及分析的基础。为了提高聚类的准确度和速度,设计了一种基于分布式Hadoop平台和熵加权特征选择的数据挖掘方案。该方案首先采用无回路有向图对Hadoop平台下的Map Reduce作业流调度问题进行了分析。然后采用并行Map Reduce执行过程完成分布式计算。最后,采用熵加权聚类算法实现海量数据挖掘。仿真结果显示,提出的数据挖掘方案具有较好聚类效果和运行效率。
其他文献
目的:探讨肌钙蛋白I(cTnI)及心电图对不稳定型心绞痛(UAP)患者危险分层与近期预后的价值。方法:序贯收集某院2015年1月~2016年9月急诊UAP患者136例资料,均于入院0h采集血样测定cTnI
目的:研究复治痰菌阴性肺结核病灶活动性的影像学特征,总结肺结核由活动性向非活动性转归的影像学特点。方法:回顾性分析2015年1月~2016年12月复治痰菌阴性肺结核患者62例,观察
目的:探讨磁共振诊断股骨头缺血性坏死的临床效果和价值。方法:选取2015年6月~2016年6月间某院接收的120例股骨头缺血性坏死患者为研究对象,根据就诊顺序,将其分为对照组和观
超声振动加工在难加工材料方面的应用越来越广,而在镗削中的应用不多。声振系统性能的好坏直接影响到超声加工质量,而实验表明单激励振动仍不能满足不断提高的加工要求。针对