虚拟集群环境下多虚拟机协同检查点容错系统

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:xiaofan8810060855
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着虚拟集群中虚拟机数目的增加,单个虚拟机的出错往往会使得整个虚拟集群失效的概率也随之增加。因此,提高虚拟集群的可靠性,为其提供容错支持,在错误发生时保证程序运行的连续性和正确性是虚拟集群系统研究、发展、完善过程中必须要解决的一个重要问题。多虚拟机协同检查点容错系统VirtCFT提供了一种对上层应用和整个操作系统具有透明性的,特别是针对拥有消息通信机制的虚拟集群环境的新的容错解决方案。VirtCFT周期性地对各虚拟机进行协调同步,并通过避免网络通信信道中间数据包对虚拟机检查点状态的影响来使得整个虚拟集群中的虚拟机在达到全局一致性状态时做检查点备份。VirtCFT以上述方式来保证虚拟集群出错恢复时的正确性,在错误发生时能够迅速检测到错误的产生并执行恢复操作,使得虚拟集群能够保持正常运行。不同于传统容错技术需要修改应用和操作系统代码,VirtCFT提供了一套对应用和操作系统完全透明的容错平台,其所有的控制命令以及功能模块都在其所保护的虚拟机非特权域之下的虚拟层中实现,因此,现有应用软件或者操作系统不需要做出任何修改或调整的情况下就可以直接在该系统平台上运行并获得容错保护。另外,VirtCFT结合内存和IO虚拟化技术,采用虚拟机检查点增量式备份策略进行CPU、内存、磁盘等状态在内的全系统状态的冗余备份,同时对虚拟机网络在特权域中进行集中式管理,在提供透明性的同时降低了虚拟集群容错系统的运行时间开销。VirtCFT多虚拟机协同检查点容错系统基于Xen虚拟化平台实现。采用Python编写用户层工具,采用C语言编写内核层功能模块。功能测试表明:系统实现了虚拟机出错后对虚拟集群的容错恢复,并保证最终运行结果的正确性。对于计算密集型测试,提供透明性及通用性容错所引入的运行时间开销不超过30%。出错恢复时间为4.51秒~ 5.46秒。
其他文献
随着互联网的快速发展,网络应用中的协议技术研究也在迅速增加。计算机网络中的协议理解对维护网络安全具有重要的意义。但越来越多的网络协议属于私有协议,缺乏公开的规范文
本文是“室内人体异常行为识别报警系统”项目的一部分,该项目为针对室内环境的人体行为监控。旨在通过整合智能视频监控处理流程中的各大关键技术,选择适应于该特定环境的有
不确定数据是近年来在传感器网络(WSN)、无线射频识别(RFID)等领域中涌现出来的一类新数据,对不确定数据聚类分析已经成为数据挖掘领域研究的新热点。本文阐述了数据不确定性
随着网络学习资源的海量级增长,加之不同用户背景知识和兴趣爱好各异,信息需要不尽相同,传统的基于关键字匹配的信息检索技术无论从资源覆盖率、检索精度等诸多方面来看,都无
最近十年以来,移动互联网得到了快速的发展并产生了巨大的变革,也引发了各种移动设备的快速普及。同时移动设备上的各种应用也在不断的丰富和改变着我们的生活。在各类应用中
近年来,随着生物技术,尤其是高通量技术的发展,生物网络数据有了显著的增长,出现了很多的生物网络数据库,包括蛋白质反应网络,新陈代谢网络,基因调控网络,神经网络等,如何从这些浩瀚的
面向服务的体系结构(Service-Oriented Architecture, SOA)是一个组件模型,它的主要作用就是将应用程序的不同业务功能(即服务)通过服务之间定义良好的接口联系起来,然后通过
由于人们对信息安全的逐步重视,加解密技术一直是研究的热点。各种加密算法相继问世,但加解密算法的安全性与复杂性始终是两个不可调和的矛盾体,在加解密速度和安全性上无法
源于人工智能领域语音处理技术的飞速发展,人们希望可以和机器进行更自然、贴切的交流。语音情感识别是继语音识别之后,人机交互中的又一热点问题,得到了研究者们广泛的关注
随着现代社会的快速发展及互联网应用越来越广泛,每天所产生的信息量也在急剧的增加,特别是网络数据每天都在指数倍的增加。面对这些实际存在的数据,如何从中获得对人们有用的知