论文部分内容阅读
作为主流的分布式软件系统运行支撑平台,J2EE中间件封装了一组公共服务以提高分布应用的开发、部署、维护和演化的效率与质量。Internet的普及、中间件标准化的完善以及开源软件的兴起,均不同程度地促进了中间件服务的繁荣。这种繁荣在满足用户个性化要求和适应Internet开放性的同时,也使得中间件服务的可靠性对整个系统可靠性的影响显著增加。因此为了提高分布式系统的可靠性,有必要考虑提高系统内的中间件服务的可靠性。经过长期的研究与实践,容错技术领域已形成了许多被广泛认同并使用的概念、方法与技术。尽管各种容错方法和技术都能提高中间件服务的可靠性,但是不同的容错方法其效果是不同的,即使是相同的容错方法应用到不同的中间件服务中,其对系统可靠性提高的程度也是不同的,因此有必要对系统中J2EE服务的容错配置过程进行管理,使我们能够为目标系统找到最合适的容错配置方案。容错配置管理需要解决以下几个关键问题:(1)如何选择进行容错的服务。即使将相同的容错机制应用到系统的不同服务中,其容错的效果也是有很大差别的,因此必须找到影响系统可靠性的关键服务并为其配置合适的容错机制,才能最有效的实现系统的容错配置,提高系统的可靠性;(2)如何将容错机制在系统中实现,采用硬编码的方式虽然是最直接的方法,但是这样的实现必然会导致容错配置具有较低的复用性和灵活性;(3)面对不同的容错配置方案,它们的容错效果和实现代价都有差异,如何才能对不同的配置方案进行比较和分析,并最终找到合适的容错配置方案。为了解决这些问题,本文在详细考察了目前已有的容错配置管理方法之后,提出了一种中间件服务容错配置管理方法和支持工具。试图通过此方法和工具,帮助我们找到目标系统中相对于可靠性而言的关键服务,并为关键服务配置合适的容错机制,包括错误检测机制和故障恢复机制,然后再评估为关键服务使用不同的容错配置方案后使系统可靠性提高的程度,通过对不同容错配置方案的效果进行比较分析,辅助系统开发和维护人员做出是否使用服务容错、使用何种容错方法等决策,从而能够简化分布式系统的容错配置过程,同时提高容错配置的效率。