论文部分内容阅读
工作站网络(network of workstations NOW)和Internet工作站(workstation in Internet WII)已经成为传统高性能分布式计算环境的一个高效可行的替代方案,但NOW和WII都面临着有效使用资源的问题,所以解决负载平衡问题是提高NOW和WII性能的重要因素。负载平衡分为静态,动态和混合式三种,现在研究的重点多集中于动态负载平衡。动态负载平衡中的任务调度分为集中式调度和分布式调度,前者由一个任务调度器负责收集系统负载信息,决定任务调度方案;后者由每个节点上的调度程序共同决定任务调度方案。在采用集中式调度的动态负载平衡系统中,任务调度器往往成为系统的瓶颈。很多文献研究了各种负载平衡策略,但都没有系统完整地研究恶劣环境下分布式计算环境中负载平衡系统的容错性问题。采用集中式调度的负载平衡系统对恶劣的环境显然是非常敏感的,一旦调度器发生异常,整个系统就会瘫痪,此时调度器就成为系统的瓶颈;在采用分布式调度中的负载平衡系统中,虽然每个节点都可以扮演调度器的角色,但是只要存在发生异常的节点就会影响全局调度的正确性。所以负载平衡系统的容错性是值得重视与研究的一个问题。近些年来agent技术在分布式系统的开发过程中正发挥着越来越重要的作用,日益引起人们的高度重视。越来越多的研究人员投入到这一富有挑战性的研究领域,并取得了不少研究成果。MAS的提出可大大提高系统实现的效率和易维护性,更重要的是按照这种方式设计实现的系统更接近客观世界模型,由此又可提高系统的环境适应性。所以考虑将MAS应用于负载平衡系统的设计是一种可行的选择。本文提出了采用集中式调度的动态负载平衡系统的一种通用机制。该机制通过multi-agent系统提高了分布式系统中各节点的通讯效率。节点中的agent被分为五种:监控agent,冗余选择agent,主从交互agent,任务执行agent,任务调度agent。各个节点中的agent相互协作,使所有节点都准确而快速有效地知道整个系统中节点的拓扑结构,并且整个系统的整体负载情况也能及时而又快速地被中心调度器得到,这使得负载平衡的决策更加准确。论文中详细分析了采用双机备份方式作为系统容错选择的合理性,为了解决中心调度器成为瓶颈的问题,提出了动态冗余机制,它是一种基于双机热备份方式地容错技术,具有动态性和高可靠性地特点。这种机制的动态性是以多agent间的协作实现的。动态冗余机制使得在不改变系统可用性的前提下有效地提高了整个系统的容错性能。尤其是在恶劣的环境中,中心调度器比较容易出现故障的情况下,该机制的优势更为明显。该机制是通用的,所以具有广泛的应用,并且具有灵活的实现方法。