论文部分内容阅读
随着并行处理技术的不断发展,机群系统因其良好的性价比、卓越的可扩展性与可用性,逐渐成为当前高性能计算机领域的主流结构。在机群系统中,机间通信的性能是影响整个系统性能的关键因素,因此如何提高机群通信系统的性能一直是近年来的一个研究热点。由于SMP机群逐渐成为机群系统的主流,尤其是大结点和超结点机群的出现,在机群结点计算能力不断提高的同时也提高了对机群高速通信系统的性能要求。在传统的结点内单网卡和结点间单通路的机群网络中,由于受到网络硬件设备自身的性能限制,机群通信系统的性能成为其整体性能的瓶颈。为了突破这一限制,研究者提出了在机群结点间同时使用多条网络通路进行并行通信的解决方法。在曙光4000L超级服务器机群的通信系统中,我们引入了并行通信机制,有效的改善了系统的结点间通信的带宽性能。本文在总结前人研究成果的基础上,首先系统地研究了并行通信技术的关键问题和具有代表性的并行通信实例。随后从需求出发,提出了一种基于细粒度消息分片模式的并行通信机制,较为详细的阐述了在曙光4000L机群中该机制的设计与实现,还以此为基础对异构并行通信和消息分派机制进行了进一步的研究探讨。本文中对试验平台上测试数据的分析说明,该系统上并行通信的实现基本上达到了预期的性能目标,具有较好的通信带宽。最后,本文总结了作者的工作,提出了对当前并行通信实现进行优化与改进的方法和思路,并对未来的工作做了展望。