论文部分内容阅读
集群系统是近几年来世界上进行大规模并行计算的首选系统,与以前的紧密耦合超级计算机相比,集群系统采用的是松散耦合的体系结构。一个集群组通常由许多个独立的计算节点组成,但由于各个独立的节点并非专门为集群设计,这样就必然引发了对集群可靠性和稳定性的担忧。这就需要一个专门的高速互联网络将各个独立的节点机窜连起来,而这个网络必须具备高可用、可扩展、高性能、高稳定等一系列的特点。集群通信网络的优劣直接影响集群通信效率的高低,所以目前集群间的通信成为了研究的热点。本文主要了解了现有的机间通信技术,深入的研究了目前市面上的一些高性能的机间通信技术,并对其优劣性能进行了比较,提出了一系列的通信性能的计算方法。并总结了当前提高通信效率的几种有效的方式,例如用户级通信、增强网络接口功能等等。本文的具体工作主要为以下的几个方面:(1):针对目前的集群系统提出了优化集群通信的具体方法,并介绍其实现的具体模型,为通信优化提供了具体的方向。(2):介绍了集群系统的体系结构,把节点机的通信协议优化、加强网络接口功能等方面作为集群通信优化的主要方向。(3):介绍了国外的一种Myrinet用户级通信协议,但是由于其源代码不公开,而且实现其功能要用专门商用网卡以及交换机,花费的代价比较大,本文采用mvia通信协议,并通过修改通用的千兆以太网的驱动程序实现了用户级通信。通过实验对比,性能较好并且完全免费,对于非高端的集群计算完全实用。(4):上面一点主要是通过协议底层对通信进行了优化。本文在通信协议的上层同样也做了一些工作。在用户层通过对MPICH的用户缓冲区的数据结构进行修改,节省了用户空间,通过对其缓冲池下的数组参数进行设置,增大了其每次内存注册的信息量,减少了内存的注册次数,优化了通信性能。