复杂应用场景下的海量数据处理技术研究

被引量 : 0次 | 上传用户:lijing1671
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术和网络技术的高速发展,人类的生产生活活动信息越来越频繁地被数字化,不仅数据量呈现爆发性增长,而且数据来源呈现异构特性。另一方面,数据的价值也越来越受到重视,人们期望从海量的多样化数据中挖掘有用的信息和规律。因此,如何实现对海量数据的高效处理,是近年来系统领域的研究热点,同时也获得工业界的高度青睐。海量数据处理场景主要分为两种,即离线处理和在线处理。离线处理针对已经被存储的批量静态历史数据,关注点在于吞吐量;在线处理针对源源不断产生的动态数据流,关注点在于实时性。近年来,这两种处理场景都得到了学术界的广泛关注,也产生了许多优秀的研究成果。本文主要聚焦于一类广泛存在的海量数据处理应用场景。在这类场景中,既有对静态数据进行离线处理的需求,又有对动态数据进行在线处理的需求。本文的工作主要有两点:1)针对复杂的海量数据处理场景,提出一种基于分布式的系统架构。首先,架构可以有效支持多数据源的高速数据接入;其次,架构可以以平滑的方式为后续的离线处理和在线处理提供一致的数据流,将两者有机结合,兼顾吞吐量和实时性的需求;第三,架构可以支持离线处理和在线处理的结果在业务层面上的融合汇聚。我们从理论上对架构的合理性给予分析,并从实验和应用层面对架构的有效性进行说明。2)针对海量数据处理场景中的分布式任务分配需求,提出一种去中心化的分布式任务分配方法。在我们提出的方法中,没有中心节点的参与,所有节点以对等的形态参与任务分配过程,因此避免了主从结构方法中由中心节点异常带来的系统失效风险。我们从理论上阐述了去中心化任务分配方法的有效性,并与主从结构任务分配方法进行对比,得出各自的优缺点和适用场景。本文提出的架构和方法,不仅在理论上证明是可行的,而且已经真正运用到了实际的应用场景中,经过了较长时间生产环境的考验,具有非常强的实用价值。
其他文献
<正>近年来,以无人攻击机为代表的智能化无人系统成为军事强国发展的热点。美国X-47B无人攻击机成功完成自主空中加油试验,美国海军无人水面艇开展集群攻击演练,地面仿生机器
我国《专利法》第65条规定了专利侵权损害赔偿的原则和四种计算方式:按照权利人因被侵权所受到的实际损失、按照侵权人因侵权所获得的利益、参照该专利许可使用费的倍数合理确
硕士研究生作为国家培养的高水平专业人才,是我国实现“人才强国”的重要力量。为了进一步促进体育事业的发展,教育部于2009年开始招收全日制体育硕士专业学位研究生,旨在培
残酷的巧合——演习变成悲剧   2000年 8月 14日清晨,从俄罗斯国防部传出消息:“库尔斯克”号核潜艇在俄海军举行的一次演习中因出现机械故障,现沉没于巴伦支海海底,共有 107名
<正> 谚语是流传于民间的简练通俗而富有哲理的语句,是人们劳动和生活经验的总结。在漫长的岁月里,它们经过千锤百炼,形成内容精辟、寓意深邃、脍炙人口的民族语言,在文学宝
农民工是我国改革开放的产物,是我国社会转型时期一个非常特殊的阶层。正确认识农民工在我国经济社会发展中的地位与作用意义重大。本文从农民工群体面临的处境和问题出发,探
分时长期演进(TD-LTE,Time Division-Long Term Evolution)是由我国主导推出的4G移动通信国际技术标准,它有效提高了数据速率和频谱利用率,其上下行峰值传输速率分别达到50Mb
在当代认知语言学对象似性研究的基础上,指出象似性在文学中的标记性用法是作家取得文体特征的重要方式,并从词汇、句法、篇章层次对20世纪盛行于西方文坛的意识流小说中的心
<正> 一、前言在气炼熔制石英玻璃坨的工艺过程中,送粉量的变化,直接影响着石英坨质量的好坏。如送粉量不均匀,将会产生气泡和造成石英坨不等经。为了解决这一问题,必须对送
加强战备训练是提高专科手术队保障能力的重要途径。本文根据专科手术队任务特点与要求,剖析其训练的现状与存在的问题,并从训练内容、训练方案、考核评估三个方面提出对策。