云环境下版本控制及任务调度优化技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:zhumengen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
云计算技术的快速发展使得云计算平台成为支持IaaS的基础性设施,为用户提供大规模的虚拟化资源。分布式计算框架如MapReduce和云计算技术相结合使得对海量数据进行挖掘与分析成为可能,直接促进了大数据时代的到来。本文基于典型的分布式云计算平台深入研究了虚拟机集群的版本控制问题,同时围绕MapReduce分布式计算框架下的作业实时进度估计和面向作业时限的任务调度两个问题开展了研究。本文主要工作具体如下:针对已有方法在处理版本控制问题时,由于需要进行不同程度的版本数据传输和差异数据计算,导致耗时长和存储端负载压力大等问题,我们提出了一种新颖的扁平化版本控制方法。该方法在本地增量生成版本,在版本恢复时使用缓存树结构按需传输版本数据。实验显示我们的方法能有效地加速大规模虚拟机集群的版本控制过程,同时将负载压力分散在各节点,避免了性能瓶颈。针对已有方法在对MapReduce作业进度进行估计时,由于采取粗粒度的估算方法,或是使用静态采样的方法而未考虑作业执行期间的状态动态变化,导致估计不全面、精度低和实时性不好的问题,我们提出了一种作业实时进度的迭代估计方法。该方法为MapReduce作业建立三阶段模型(Map、非重叠Shuffle和Reduce阶段),并在作业运行期间,基于作业历史数据和运行状态信息来迭代地计算各阶段的持续时间,以准确地估计出实时的作业完成时间,并最终将其转换为作业实时进度。实验结果表明该方法在反映作业进度实时性变化方面性能提升显著,同时也有效地提升了作业实时进度的估计精度。针对已有方法在为MapReduce作业提供满足时限的功能时,出现的无法在时限前完成作业和无法在时限内处理最大数据量的问题,我们提出了一种满足MapReduce作业时限的任务调度方法。该方法在调度Map任务时,使用一种面向作业时限的迭代-逼近的任务调度算法以判断是继续还是终止Map阶段。终止Map阶段后,作业剩余未完成部分继续执行,此时该方法使用一种修正算法以进一步确保能在时限前完成作业,同时校正处理的数据量。实验显示该方法不仅能有效满足作业时限,还能在时限设置过低或是资源分配不足的情况下处理几乎最大的数据量。
其他文献
随着无线网络技术的发展,面向各类需求的无线网络相继出现,但这些网络由于特定的需求都不能取代其他所有的网络,所以异构无线网络互联技术一直是无线网络研究的一个热点,同时
近年来,基于内容图像检索逐渐成为一个活跃的研究领域。但由于当前图像理解技术的局限以及人类视觉认知的主观性,使得依赖于低层视觉特征的基于内容图像检索系统难以满足用户
无线传感网络作为一个相对较成熟的技术,已经应用在生活,军事,医疗等众多领域。而本课题将其运用在皮划艇激流回旋比赛的判罚系统上,减少裁判员的工作量,增加判罚的准确性。目前,对
水声传感器网络是一门新兴的网络技术。它是一种水下无缆通信网络,通常由声连接的海底传感器节点、自主式水下运载器和作为主节点的海面站组成的水声无线通讯网络。它们被部
随着Internet的快速发展,网络所蕴涵的信息量急剧地膨胀。现有基于Client/Server模式的搜索技术,存在着服务器单点失效、信息更新周期长、缺乏语义支持等不足,极大地限制着搜索
制造执行系统(Manufacturing Execution System,MES)是制造企业计算机信息系统集成的纽带,作为大型钢铁企业,制造执行系统是提高生产效率使其实现车间生产敏捷化的一个重要的
股票市场是一个高度复杂的非线性动态系统,其变化规律既有一定的自身的趋势性,又受政治、经济、心理等诸多因素的影响,各因素的影响程度、时间范围和方式又不尽相同,造成异常复杂
随着多媒体技术的快速发展,可以同时提供录像、画面分割、网络传输、云台镜头控制、报警控制等多种功能的嵌入式DVR(digital video recorder),在安防监控领域取得了广泛的应用,逐
随着虚拟化技术的不断发展,云计算平台以其灵活性、便利性、高扩展性等优势成为热门的学术研究领域并被广泛应用于企业之中,而其实质则是依托于虚拟化技术来构建的、后端基础
随着计算机网络规模扩大、复杂性增加,网络安全问题也日益突出。传统的静态安全防御策略(如访问控制机制、加密技术、防火墙技术等)对复杂网络环境下层出不穷的攻击缺乏主动