基于MapReduce的网络流量分析系统及其性能优化研究

被引量 : 1次 | 上传用户:hlxc8k
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网逐步走向大数据时代的今天,行业中的各个部分都在不断的受到大数据的冲击,网络流量分析也不例外。随着网络带宽的逐步提升,网络流量数据也在不断增加。现有的数据量已经远远超出普通服务器所能处理的范围,而且还有继续大幅增长的趋势。于是,使用大数据平台成为了势不可挡的趋势。Hadoop平台作为业界广泛接受的分析平台,成为了最佳的解决方案。本文围绕Hadoop中MapReduce技术在网络流量分析中的应用展开,以实际生产环境为背景,设计了基于Hadoop的流量分析程序。程序以MapReduce为基础,实现了在大数据量情况下的数据分析,有效地将MapReduce的各项技术融入到分析程序中,使得分析程序更加高效、简洁。为了进一步提高分析程序的效率,本文对MapReduce作业的实现进行了分析。通过分析MapReduce框架的执行流程,总结了影响MapReduce执行效率的主要因素及其对作业运行时间的影响。同时通过实验验证了这些结论,证明了分析的正确性。最后,在分析结论和网络流量分析的任务特点的基础上,本文提出并实现了基于MapReduce的多作业合并组件。该组件主要针对网络流量分析中同一输入数据反复使用的场景,提供了一个接口简单的函数库,能让作业的编写者在几乎不需要修改代码的情况下,利用原生Hadoop框架,实现多个作业的合并运行。合并后的作业能通过一次读取输入数据,完成多个分析任务,从而有效地减少了数据读取所消耗的时间,明显地提高了分析任务的整体运行效率。同时依据实验,通过几个典型场景以及生产中使用的实际分析作业,验证了合并组件的效果,证明了这一解决方案的有效性。
其他文献
作为服务业的重要组成部分,旅游业也广泛存在着产业集群现象,然而,学术界大部分关于旅游产业集群的研究都是移植产业集群的理论成果,对旅游产业集群自身网络特征和运行机制等
活塞式压力平衡装置是深海探测设备中平衡深海大压力的重要装置。活塞在深海下既要灵活移动,又要密封可靠;这是现有活塞密封技术遇到的新问题和挑战。本文针对深海下活塞密封问
基于动态搜索的Android应用测试方法通过动态搜索Android应用的用户界面状态空间,构建GUI模型,并据此生成测试用例,实现对Android应用的自动化测试。然而传统的深度优先模型
东汉公文的骈俪之风.肇源于西汉武帝时期。以歌功颂德、劝百讽一为目的的汉赋在西汉中期发展到鼎盛,特有的雄风演变到东汉,趋于华丽,之后愈演愈烈,到汉末形成一种骈俪之风,用典故。
福柯是当代最重要的思想家之一,他从文学、历史、社会学、政治学和哲学中提取能量,形成了自己独特的理论体系。这些理论又与各种知识遗产产生思想撞击,裹挟着强大的生命力,为
随着工业自动化的快速发展,基于机器视觉的尺寸测量技术已经在众多工业领域发挥着重要的作用,如航空、船舶和汽车。传统尺寸测量技术操作复杂,测量效率低,有时还必须借助于昂贵的
魏晋南北朝时期公文文种丰富,文体大备,名篇迭出,是公文写作大发展、公文理论大繁荣的时代。相关文论著述中关于公文行文运笔的论断,涉及公文之“辞约旨丰”、行文简约,公文
随着社会责任逐渐受到学术界和业界的广泛关注,作为一种既包含经济责任,又包含社会责任的新型投资模式,社会责任投资为我国企业社会责任的发展开辟了新的方向和道路。同时,投资者
汉魏六朝时期对公文写作主体的批评主要体现在对主体才性气质的批评、对主体道德修养的批评以及对主体职业修养的批评上。尤其是对主体职业修养的批评,是对公文主体不同于文
随着移动互联网的发展和智能手机等移动终端的普及,二维码技术在博物馆图书馆的应用也越来越多。论文在对国内外博物馆展品信息管理系统的调研基础上,结合(中华航天博物馆)展品的