论文部分内容阅读
随着Intemet的普及和社会信息化的不断发展,越来越多的商业应用系统被开发和部署到各商业企业和公共服务部门中,在社会生活的各个领域扮演重要角色.机群计算环境(Cluster Computing Environment)作为日益成熟的高性能分布式计算环境,以其在高性价比、可扩展性强等优势,成为商业应用服务优先选择的平台环境.机群在商业应用领域的广泛应用,形成了基于机群的商业应用模式.
商业应用结构复杂,而应用负载随机波动、不可预测,使得应用往往无法提供稳定的服务质量,在一些极限情况下(如负载峰值),应用服务质量更是急剧恶化.另一方面,机群中往往同时部署多种复杂服务,服务之间、服务内部多个应用之间共享机群资源,协同提供一定质量的服务.如何有效对应用实施管理,发挥机群的优势,提供满足客户需求的服务,亦是机群应用管理中迫切需要解决的问题.
自适应技术充分考虑到环境或结构的不可预计的变化,当机群资源发生改变时,系统主动发现并立即采取相应措施,实时资源再配置.当应用运行状态改变时,自行调整应用参数和属性,有效共享资源,提供满足用户需求的服务质量.本文研究机群应用管理系统的自适应机制,取得的主要工作及其创新性成果如下:
1) 本文提出面向机群的多层次自适应应用管理机制AAMS(AdaptiveApplication Management System).AAMS在机群(全局)、节点(局部)、应用三层分别实施自适应策略,组合管理机群应用.在全局层,AAMS采用策略驱动,根据策略实现资源再配置.在应用层采用反馈控制理论,增强应用管理力度,实现应用资源控制和性能保障.为完善机群(全局)管理策略,AAMS还引入备份实例机制,提高系统软硬件失效时的容错能力,以及在负载过重和负载大幅波动时的应用自适应能力.上述机制的实现,使得AAMS具备通用性的同时,又灵活满足不同应用的服务质量需求.
2) 本文引入接纳时间比作为控制参数,并结合PI(比例积分)控制理论,实现资源和服务质量管理机制.接纳时间比与各种性能指标强相关,可灵活实现资源管理、服务质量控制、性能隔离、过载保护等多种管理模式.基于接纳时间比的管理机制还具有应用透明性,无需了解应用细节,即可快速实施和部署,有效保护对现有系统的投资.管理机制亦具有一定的通用性,在静态和多层动态网站环境,本文分别给出了实验结果.在静态网站实验中,Pl反馈控制的效果明显优于未控制和使用开关控制情形:吞吐率较未控制增长最多可达50﹪,较开关控制增长25﹪;请求丢弃率较未控制减少99.7﹪,较开关控制减少88.3﹪;响应时间较未控制降低75﹪,较开关控制降低43﹪.实验结果表明,基于PI设计的资源和服务管理机制,能适应不同的使用环境和多种管理模式,获得良好的控制效果.
3)本文在机群应用管理系统中首次引入LQR(线性二次型最优调节)控制理论,使得系统可直接面向性能指标实现自适应资源和服务质量管理.长久以来,Pl理论是最为广泛应用的控制理论.LQR(线性二次型最优调节)理论由于对系统模型的准确程度要求较高,且控制器参数物理意义往往不明确,使其在现实中的应用受到了一定的限制.同样的,在静态和多层动态网站环境,本文亦分别给出了基于LQR的资源和服务管理机制的资源使用率和响应时间控制的实验结果.
4)本文将LQR理论应用进一步拓展,实现基于接纳时间比策略的服务质量区分机制.基于接纳时间比的差别服务机制可自适应地持续满足多种等级客户的服务质量需求.实验表明,服务区分机制,对高优先级客户提供更好的服务,实现低延迟高吞吐的同时,避免了低优先级用户的饥饿情形.