【摘 要】
:
云计算技术包含分布计算、并行处理、虚拟化等技术,其极大提高了计算能力。随着数据处理量的增加,计算任务越来越多,人们追求提高计算速度的同时降低对硬件的要求。虽然云计算技
论文部分内容阅读
云计算技术包含分布计算、并行处理、虚拟化等技术,其极大提高了计算能力。随着数据处理量的增加,计算任务越来越多,人们追求提高计算速度的同时降低对硬件的要求。虽然云计算技术发展的比较成熟,并且已经出现很多成型产品,但是在数据挖掘领域依然很欠缺。很多数据挖掘算法对处理海量数据挖掘问题都存在很多困难,有些甚至不能计算出结果。因此将算法用并行的方式进行计算是未来数据处理的一个趋势,可以很大程度的降低运行成本和计算时间。MapReduce架构被看作为云计算的核心技术。算法在云计算平台上实现意味着将算法转换成MapReduce架构的模式实现。但是并不是所有数据挖掘算法都可以转换成这种模式,而且待处理的数据也不一定能很好的进行数据分片,因此算法的MapReduce化的实现存在很多困难。本文提出三种数据挖掘算法的MapReduce结构化实现(即云平台上的实现策略)和理论依据,并给出了数据分片的方法。有些算法的实现过程与原始算法截然不同,但都遵循原算法的核心思想,并且计算结果也证明是正确的,同时发挥并行计算的优势,减少系统总运行时间。
其他文献
近年来,随着我国注册会计师行业做大做强发展战略的实施,会计师事务所为满足自身客户资源的分布,不断通过各种方式建立分所,提高会计师事务所的竞争力。然而,分所的开设受国家政策
企业要发展需要盈利,微型企业要发展更需要盈利。陋饰铭是一家从事手工皮具行业的微型企业,深刻感受到在当今机械化规模化生产为主导的经济社会里,想要做出规模,就必须要把特色和
<正>患者,女性,56岁,外院体检CT提示肝右后叶占位,考虑恶性肿瘤来我院就诊。收入院考虑射频治疗。检查结果:肝炎病毒标志物阴性,肿瘤标志物阴性,肝肾功能正常。询问病史,患者
随着我国电力体制改革的逐步推进和经济全球化的发展,电力企业发展模式将由经营型替代了以往的生产型,科学的财务管理在企业经营模型中具有至关重要的位置,也将在企业的发展中起
从某种意义上看,银行的资本充足率监管的发展史实际上就是一部有关银行稳定与银行绩效相互博弈的历史。[1]2010年12月《巴塞尔协议Ⅲ》出台后,各国银行监管当局纷纷致力于新资
海洋是人类宝贵的资源,是人类迈向更高文明发展的立命之本。随着科学技术和生产力的飞速发展,人们对海洋开发和利用的程度也越来越高。然而,自工业化以后,由于人类不加节制的
电子邮件写作教学是英语写作教学的一种方式。本文采用实证研究的方法,通过教学实验,考察了电子邮件写作教学对学生英语写作水平和非语言能力的影响。结果表明:电子邮件写作教
近年来,企业员工对于薪酬的重视程度越来越高越,薪酬已经成为了一个非常敏感的话题,同时对于员工来说薪酬已经成为影响他们去留和工作积极与不积极的重要因素。目前大部分企业在
本文分析了影响光学纤维面板(简称光纤板)红外响应诸因素,在此基础上着重研究了光纤板玻璃组分,提高了光纤板芯玻璃的折射率并改善了光吸收玻璃的吸收效果,新研制出与美国伽
随着知识经济时代的到来及我国高等教育大众化和教育管理体制改革的深入,地方性高校校友会工作已经成为高校发展的支撑力量之一。目前校友会工作存在认识不到位等困难,更新观