万亿次机群系统NPB性能评测与并行非数值算法实现及性能分析

来源 :中国科学院软件研究所 | 被引量 : 3次 | 上传用户:yh124712
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高性能计算正处于一个新的快速发展时期,有两个现象值得关注,一方面,并行计算机的峰值性能提升迅速,峰值计算速度高达百万亿次的计算机系统已经被研制成功,高性价比的机群(cluster)成为高性能计算机的主流架构,促进了高性能计算在更多领域的普及应用;另一方面,并行应用软件缺乏,高性能计算机的实际效率长期以来处于较低水平,当前大型并行应用软件仅能发挥20%以下的系统峰值性能。 应用性能才是用户最关心的,也是最重要的。并行软件和应用水平已经成为高性能计算发展中的薄弱环节,应该给予更多的重视。并行计算机和并行应用程序是影响并行计算性能的两个主要方面,也是本文的研究重点。 本文以3个万亿次机群系统为平台,利用有着很强应用背景的NPB(NAS Parallel Benchmarks)进行性能测试分析。NPB程序包的8个程序都来自于实际应用领域,是科学计算领域并行应用的典型代表,NPB性能评测属于面向应用的性能评测,可以较真实地表现出系统的拟应用性能。 通过NPB测试,重点研究在大规模并行处理时(处理器数目达到上千个)系统的性能特点和趋势。分析了不同的处理器、互连网络等系统配置对NPB性能的影响,发现NPB的8个程序在3个万亿次机群上的性能特点和表现并不一致,表明国产高性能机群在设计上正在逐渐走出同质化的趋势,向多样化发展。进一步分析表明,目前NPB程序的可扩展性可以达到几百个处理器,但尚不能达到上千个处理器,NPB程序能发挥出的系统峰值的百分比仍然徘徊在10%左右,机群系统的并行可扩展性和应用程序对机器运算潜能的利用还需要进一步提高。对于处理器数目达到上千个的万亿次机群系统来说,对聚合通信和细粒度通信能力的支持亟需提高。 高性能并行计算在非数值领域有着广泛的应用前景。本文介绍了一个自主开发的基于MPI的并行数据挖掘系统(关联规则挖掘),在2个机群系统上进行了加速比性能测试,分析了程序的并行特点。结果表明,在非数值并行应用中,应当做好数据划分,精心设计优化数据结构,尽可能利用程序与易并行程序相类似的特点,这样可以有效减少进程间通信,实现负载均衡和同步计算,使得程序有较好的并行性能。
其他文献
本课题将研究加强Web服务安全性、可靠性的途径,建立和实现一个完整的Web服务安全模型,力图为用户提供安全可靠的Web服务。 为此,研究了现有的XMLWeb服务安全相关技术,力图在
随着计算机技术的高速发展和计算机应用的日益普及,社会对计算机应用人才也提出了更高的要求。尽管目前很多教师和专家已认识到培养学生实践动手能力的重要性,但在实践中由于
XML作为Web发展所带来的新技术中的代表,已经成为网上数据表示和交换的标准,并逐渐成为了学术界和工业界所关注的焦点。由于XML数据具有不同于传统数据形式的特点,因此,在各
对于远距离、小目标的判读的传统方法通常是采用胶片或录像带记录图像,然后由人工进行标定和判读,该方法存在的问题是:劳动强度大,工作效率低,判读准确度低。本文针对靶场中靶标检
手绘图形是人类思维外化的一种重要表现形式,它以自然、简单而灵活的方式表达绘制者的意图,以良好的视觉形象传递概念,在工程设计、动画制作等诸多领域有着广泛的应用。随着