基于MapReduce的数据挖掘平台设计与实现

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:naomi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
MapReduce编程模型的简单性和高性价比使得其适用于海量数据的并行处理。然而,MapReduce欠缺对多数据源、组件复用以及数据可视化支持,这些缺点使用户在运用MapReduce框架进行数据挖掘时暴露出开发效率低下,重复开发等问题。提出了一种基于MapReduce的数据挖掘平台的设计与实现,该设计思想为Hadoop作为大规模数据计算平台在数据挖掘、数据可视化以及商业智能应用方面的不足提供了参考与弥补。同时,基于该方法实现了一个大规模数据挖掘工具。
其他文献
[目的]分析排除了自然生长因素后,功能矫治器治疗安氏Ⅱ类错牙合畸形引起的下颌骨的改变,从而更为真实、准确地评价该类矫治器的矫治效能。[方法]运用Meta分析技术对功能矫治
国际化发展在日益加快,这极大的促进了公司证劵化的发展历程。在上市公司持续发展过程中,我国的法律法规也越来越趋于规范化,上市公司须得建立行之有效的企业内部控制体系,以
电阻是导体本身的一种性质,在一般情况下,它是个定值,不同的导体,其电阻值一般也不相同。电阻的测量既是初中物理中的一个重点,又是一个难点,因其涵盖的知识面和应用的技能
通过分析江西省地勘单位所面临的机遇和挑战,剖析自身优势,展望地勘单位与地方经济的结合点,探索出相关的针对性策略.
着舰飞行过程中的轨迹跟踪控制能力是影响舰载无人直升机性能的关键因素,针对无人直升机模型不确定性和在飞行时受阵风干扰的问题,基于扩张状态观测器(extend stated observe
载人火箭信息传输网络系统是为适应载人运载火箭远距离测试和发射控制而研制,系统采用热备份路由及重传验证信息传输方法,实现了高效、高可靠的地面信息交换平台。在系统框架
在空战对抗中,通过综合参战实体各项战技指标,从理论上拟合单个实体对对方的杀伤概率。基于VR-Force开发环境,进行协同空战任务分配研究。根据任务分配方案,对每个参战实体制
随着肥胖及与之相关的胰岛素抵抗发病率不断上升,非酒精性脂肪肝逐渐成为常见的肝病之一。本文将从脂肪因子、脂类代谢及基因多态性等方面对非酒精性脂肪肝分子机制的近期研
随着经济的快速发展,企业作为一个主要的市场主体,尤其是各种形式的公司,发挥着重要的不可替代的作用。企业财务报表的粉饰行为是一种不良的市场机会主义的倾向,对于企业的真
经典PageRank算法单纯地考虑到对网页的链接结构进行分析,而不能考虑到网页在搜索主题方面的相关性和权威性,以及用户对新旧网页的依赖程度的不同。针对经典PageRank算法存在