【摘 要】
:
21世纪人类进入了信息化的时代,在这个阶段,利用计算机网络处理数据是信息系统最常见的功能。互联网可以说是目前全球上最大的信息平台,数据具有大型的,多样化的,异构的,动态
论文部分内容阅读
21世纪人类进入了信息化的时代,在这个阶段,利用计算机网络处理数据是信息系统最常见的功能。互联网可以说是目前全球上最大的信息平台,数据具有大型的,多样化的,异构的,动态的特性。如何将这些庞大的数据进行整理分析,帮助企业提取有价值的信息,已经成为软件系统开发过程中的一项巨大挑战。云计算技术的出现为数据挖掘技术的发展带来了新的机遇。拥有巨大的存储和计算能力的云计算技术,通过部署在大量廉价的普通PC上,实现海量数据的存储和分析,集群的规模可大可小,而且相对于高性能计算机,普通PC要廉价的多,这样存储成本和计算成本都有所降低,使得基于云计算的大数据的数据挖掘变成可能。Hadoop是一个相对成熟的开源云计算框架,因其高效、可扩展性好,适合大规模计算以及其成本优势已被广泛应用在相关领域。本论文将Hadoop和数据挖掘算法Apriori算法整合,即在云环境中实现Apriori算法,以提高处理大数据的算法执行效率。在这篇论文中,我们所使用的方法有如下几种:文献研究的方法,结构化研究方法,范例分析的方法。文献研究,以了解当前的形势,为本文提供了理论上的参考。例如传统的Apriori算法分析方法和实施过程,并证明了与Hadoop框架相结合的可行性。在本文中,一个典型的数据挖掘系统架构是:提出了基于Hadoop的数据挖掘系统的体系结构,以及各个功能模块进行了简要描述。Apriori算法在处理大数据时的瓶颈在于时间复杂度过高。针对Apriori的这个缺点,将Apriori算法与Hadoop框架相结合,并对结合之后的Apriori算法进行数据挖掘测试。
其他文献
医学图像对于医生诊断病情具有重要意义,良好的医学图像分割能够帮助医生迅速判断病人病情并采取良好措施使病人恢复健康。伴随着计算机图形技术的迅速发展计算机医学图像处理
绩效管理作为现代人力资源管理的核心环节,是确保员工的工作和组织的战略目标保持一致的过程。招商银行兰州分行作为招商银行系统内的一级分支机构,始终秉承“以人为本,严格
车辆的大规模的增加导致交通堵塞日益严重,对于驾驶者而言,随时了解各个路段的交通情况是必不可少的。通过手机等移动终端浏览网页,可以让驾驶者了解到实时信息,但是由于手机等屏
物流作为一个产业,它的产生有其必然性,而第三方物流的快速发展促使传统物流迅速向现代物流转变,并使物流出现了专业化、国际化、共同化和信息化的趋势,因此现代物流的发展在很大
储物柜被广泛应用于公共场所。传统的储物柜在安全性、便利性以及方便管理方面都有很多值得改进的地方。随着电子技术的发展,电子储物柜开始进入人们的视野。最常用于大型超
为了提高对分布式拒绝服务(DDoS)攻击源反向追踪的效率和准确度,提出了一个新算法,此算法在AMS(Advanced Marking Schemes)算法的基础之上与自治系统(AS)相结合,将路由器分成
目的肾细胞癌(Renal cell carcinoma, RCC)占男性新发癌症的4%,在女性新发癌症病例中占3%,与其他实体肿瘤不同的是,肾癌对肿瘤的传统疗法均不敏感,如放射治疗、化学治疗等.但
在经济与科技都飞速发展的今天,全球化的趋势也已日渐明显。企业发展到一定程度后,选择国际化战略将为其带来更多的资源和收益,当然同时也需要企业付出更多的努力。创新是企业生
中共中央《关于面向21世纪加强和改进党校工作的决定》明确指出“各级党校要积极扩大办学规模,提高办学效益,按照优化结构、扩大规模、集中办学、资源共享的原则,统一规划培
随着我国改革开放的不断深入,我国社会的各个领域发生了巨大变化,人们传统的价值观念受到了不同程度的冲击和影响,当代大学生更是如此。作为中国特色社会主义现代化建设的主