云环境下版本控制及任务调度优化技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户：zhumengen

【摘要】

：

云计算技术的快速发展使得云计算平台成为支持IaaS的基础性设施,为用户提供大规模的虚拟化资源。分布式计算框架如MapReduce和云计算技术相结合使得对海量数据进行挖掘与分析

【作者】

：

胡明昊

【机构】

：

国防科学技术大学

【出处】

：

国防科学技术大学

【发表日期】

：

2015年期

【关键词】

：

云计算 MapReduce 版本控制进度时限任务调度

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

云计算技术的快速发展使得云计算平台成为支持IaaS的基础性设施,为用户提供大规模的虚拟化资源。分布式计算框架如MapReduce和云计算技术相结合使得对海量数据进行挖掘与分析成为可能,直接促进了大数据时代的到来。本文基于典型的分布式云计算平台深入研究了虚拟机集群的版本控制问题,同时围绕MapReduce分布式计算框架下的作业实时进度估计和面向作业时限的任务调度两个问题开展了研究。本文主要工作具体如下:针对已有方法在处理版本控制问题时,由于需要进行不同程度的版本数据传输和差异数据计算,导致耗时长和存储端负载压力大等问题,我们提出了一种新颖的扁平化版本控制方法。该方法在本地增量生成版本,在版本恢复时使用缓存树结构按需传输版本数据。实验显示我们的方法能有效地加速大规模虚拟机集群的版本控制过程,同时将负载压力分散在各节点,避免了性能瓶颈。针对已有方法在对MapReduce作业进度进行估计时,由于采取粗粒度的估算方法,或是使用静态采样的方法而未考虑作业执行期间的状态动态变化,导致估计不全面、精度低和实时性不好的问题,我们提出了一种作业实时进度的迭代估计方法。该方法为MapReduce作业建立三阶段模型(Map、非重叠Shuffle和Reduce阶段),并在作业运行期间,基于作业历史数据和运行状态信息来迭代地计算各阶段的持续时间,以准确地估计出实时的作业完成时间,并最终将其转换为作业实时进度。实验结果表明该方法在反映作业进度实时性变化方面性能提升显著,同时也有效地提升了作业实时进度的估计精度。针对已有方法在为MapReduce作业提供满足时限的功能时,出现的无法在时限前完成作业和无法在时限内处理最大数据量的问题,我们提出了一种满足MapReduce作业时限的任务调度方法。该方法在调度Map任务时,使用一种面向作业时限的迭代-逼近的任务调度算法以判断是继续还是终止Map阶段。终止Map阶段后,作业剩余未完成部分继续执行,此时该方法使用一种修正算法以进一步确保能在时限前完成作业,同时校正处理的数据量。实验显示该方法不仅能有效满足作业时限,还能在时限设置过低或是资源分配不足的情况下处理几乎最大的数据量。

其他文献

异构无线网络互联与接入关键技术研究与实现

随着无线网络技术的发展,面向各类需求的无线网络相继出现,但这些网络由于特定的需求都不能取代其他所有的网络,所以异构无线网络互联技术一直是无线网络研究的一个热点,同时

学位

异构无线网络互联网络协议无线网络接入

基于内容的图像检索相关反馈研究

近年来,基于内容图像检索逐渐成为一个活跃的研究领域。但由于当前图像理解技术的局限以及人类视觉认知的主观性,使得依赖于低层视觉特征的基于内容图像检索系统难以满足用户

学位

基于内容图像检索相关反馈协同过滤自适应机制语义标注

水门碰杆自动判罚系统的设计

无线传感网络作为一个相对较成熟的技术，已经应用在生活，军事，医疗等众多领域。而本课题将其运用在皮划艇激流回旋比赛的判罚系统上，减少裁判员的工作量，增加判罚的准确性。目前，对

学位

无线传感网络水门碰杆特定干扰排除比赛判罚动化判别系统信号处理

水声传感器网络可靠路由协议的研究

水声传感器网络是一门新兴的网络技术。它是一种水下无缆通信网络,通常由声连接的海底传感器节点、自主式水下运载器和作为主节点的海面站组成的水声无线通讯网络。它们被部

学位

水声传感器网络可靠性能量有效路由算法路由树

基于JXTA的P2P资源检索平台的设计与实现

随着Internet的快速发展，网络所蕴涵的信息量急剧地膨胀。现有基于Client/Server模式的搜索技术，存在着服务器单点失效、信息更新周期长、缺乏语义支持等不足，极大地限制着搜索

学位

对等网络搜索引擎JXTA 协议资源检索平台

基于MES的钢(铁)厂产销系统的设计与实现

制造执行系统(Manufacturing Execution System,MES)是制造企业计算机信息系统集成的纽带,作为大型钢铁企业,制造执行系统是提高生产效率使其实现车间生产敏捷化的一个重要的

学位

制造执行系统甘特图动态协调调度

基于关联分析的神经网络股票预测方法研究

股票市场是一个高度复杂的非线性动态系统，其变化规律既有一定的自身的趋势性，又受政治、经济、心理等诸多因素的影响，各因素的影响程度、时间范围和方式又不尽相同，造成异常复杂

学位

股票市场神经网络关联分析股票预测

CMFS文件系统的设计与实现

随着多媒体技术的快速发展，可以同时提供录像、画面分割、网络传输、云台镜头控制、报警控制等多种功能的嵌入式DVR（digital video recorder），在安防监控领域取得了广泛的应用，逐

学位

CMFS文件系统嵌入式DVR虚拟文件系统日志超级块索引节点位图

虚拟机集群中镜像感知和本地块缓存系统的设计与实现

随着虚拟化技术的不断发展,云计算平台以其灵活性、便利性、高扩展性等优势成为热门的学术研究领域并被广泛应用于企业之中,而其实质则是依托于虚拟化技术来构建的、后端基础

学位

虚拟机镜像位置感知块缓存和共享

基于免疫机理的入侵检测模型

随着计算机网络规模扩大、复杂性增加,网络安全问题也日益突出。传统的静态安全防御策略(如访问控制机制、加密技术、防火墙技术等)对复杂网络环境下层出不穷的攻击缺乏主动

学位

入侵检测人工免疫动态模型自体耐受克隆选择

云环境下版本控制及任务调度优化技术研究

其他学术论文