论文部分内容阅读
高性能的微处理器和高速计算机网络的出现,使得把由大量CPU组成的计算系统通过高速网络连接在一起不仅成为可能,而且变得十分容易。网络作业管理系统就是一种建立于操作系统之上,对连接在一个群集中的工作站或PC进行管理的中间软件。笔者在对这一系统进行了大量的研究之后,基于目前Internet应用的高速发展,以及客户的需求,对该系统开发了它的WEB客户端。在开发的过程中考虑到WEB服务器本身的负载过高,笔者提出将整个系统分为两个部分,一个称为OrbClient的通信模块成为设计的重点,它既与作业管理系统的服务端进行通信,又与所有的CGI程序进行通信,为实现这个模块与CGI程序之间的通信设计了一套详细的通信协议。同时,在开发工程的过程中,笔者分析、对比了大量的service程序的设计模式,选择了一种最优的模式来完成系统。 群集建立在分布式的系统之上,它是解决高性能、高可靠性和可扩展性的方向。举个例子,就像笔者所开发的WEB客户端,用户的需求来自于WAN环境中的任何地方任何时刻,为了确保其高效与稳健,完全可以利用群集所提供的性能,来达到这个目的。群集技术利用对请求的动态分配来解决其负载均衡问题,也就是将请求分配给负载比较小的节点,以更短的时间来响应用户的需求。群集技术中的故障恢复指的是在一个节点发生故障时由另一个节点对其进行接管,而当发生故障的节点被修复后,仍由原先的节点来提供服务,提出请求的用户对这样的过程是没有感觉的。笔者正是看到了群集技术这一非常有潜力的方向,提出了一种针对于网络流量的负载均衡算法——Q&R算法,得出这种优化算法比传统的算法更高效的实验结论,同时研究了关于故障恢复的检查点设置的解决方案。