基于MPI与OpenMP混合并行计算技术的研究

来源 :桂林理工大学 | 被引量 : 0次 | 上传用户:speed5188
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在高性能计算技术研究领域,机群系统具有良好的可扩展性与高性价比,受到越来越多的大学及科研机构的青睐。随着计算机集成技术的不断发展,多核技术开始大行其道,双核及四核的处理器随处可见。以多核PC机为节点组合而成的机群系统,不仅能够提供强大的计算能力,而且方便易用。然而适合于多核机群的并行编程模型相对滞后,使用传统单一的MPI消息传递并行模型无法充分的发挥节点上多处理器的运算能力,从而使得整个机群系统不能取得理想的性能。   针对该多核机群系统既有分布式存储又有共享存储的硬件结构特点,在节点间应用MPI消息传递、节点内部应用OpenMP共享存储的混合并行编程模型。MPI+OpenMP混合模型贴近于多核机群的体系结构,结合了消息传递与共享存储两种编程模型的优点,优化了节点内部通信。   本文在详细介绍多核处理器体系结构和机群系统的基础上,分析了基于MPI+OpenMP的两种混合模型,即MPI+OpenMP粗粒度混合模型与MPI+OpenMP细粒度混合模型。在MPI+OpenMP粗粒度混合模型程序中,加入OpenMP制导语句时必须整体上考虑程序的并行方案,要解决MPI通信的线程安全、数据竞争、线程的交互、程序语义的正确等问题,需要引入大量的同步点,使得程序的耗费增加,综合于程序的系统开销与程序开发难度这两个因数,我们选择了MPI+OpenMP细粒度混合编程模型。重点讨论了基于混合模型机群系统的时间开销,对程序进行性能单元分析,提出了一系列相对应的优化策略。构建了多核机群系统的软、硬件环境,并且对机群进行通讯性能测试与分析。在多核机群单节点上进行纯MPI程序与纯OpenMP程序测试比较,多个节点上进行纯MPI程序与MPI+OpenMP细粒度混合编程模型程序测试比较,根据实验数据分析,MPI+OpenMP细粒度混合编程模型比传统的纯MPI编程模型更适合于多核机群,更能充分地利用好多核机群的硬件资源。最后,总结了本论文所做的工作,并指出有待进一步研究的问题。
其他文献
行动推理和知识表示是人工智能的重要研究领域。行动推理在认知机器人、Web服务、工作流等多个领域中得到应用。行动推理的主要任务是给出系统的初始状态和变化规则来预测某
数据聚类是数据挖掘中的一个重要分支,目前已有的数据聚类算法大部分局限于处理只具有连续属性的数据,另外有少量的算法局限于处理只具有标称属性的数据,如果只处理一类属性,
AVS-M是新一代先进的用于移动视频的图像压缩编码标准,是我国自主制定的音视频编码技术标准AVS的第七部分,是为了适应数字存储媒体、网络流媒体、多媒体通信等在移动通信应用
随着互联网和多媒体技术的发展,特别是在数码相机、扫描仪等多媒体设备的日益广泛普及,使数字图像的数量飞速增长,如何快速而有效地从海量图像数据库中查询到用户所需要的图
随着互联网大规模的普及、信息时代的高速发展,网络数据量呈爆炸式增长趋势,产生信息过载问题。如何从海量数据中快速获取自己真正想要的信息一直是个研究热点。目前,推荐系
随着计算机软硬件技术的飞速发展,图像处理技术已经被广泛地应用于生活的各个领域。图像分割作为图像分析中的关键步骤,一直是图像处理技术研究中的热点和焦点。图像分割是将
学位
随着Interact的不断发展和普及,Web应用系统得到了广泛的使用。进入Web2.0时代以来,基于框架的Web开发逐渐成为主流开发技术。由于Web应用的分层开发及框架本身限制,单一框架很
随着计算机软、硬件技术的迅速发展,高性能计算逐渐在越来越多的行业中得到应用。并行计算是实现高性能的一种重要的技术途径,其关键环节是并行程序设计。串行程序并行化作为
? ? ? ? ? ?随着Internet的迅猛发展与普及,以及宽带网络建设的日益完善,网络开始带给人们形式多样的信息。从在网络上出现第一张图片到现在各种形式的网络视频、三维动画,人
本文所研究的限量弧路由问题(Capacitated Arc Routing Problem,CARP)是一个经典的组合优化问题。它在现实中具有非常广泛的应用,如冬季撒盐路由、城市垃圾清理、信件投递等现