多级混合并行编程模型及方法研究

来源 :齐鲁工业大学 | 被引量 : 0次 | 上传用户:zhe0731
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着未来计算机微处理器朝着众核处理器方向的发展,以及大规模机群的不断出现,基于异构平台的混合并行编程在今后的大规模并行应用中必将成为主流。在多核体系上,传统的并行编程技术并不能高效地适用,针对多核集群的特殊体系结构,研究相应的编程模型和并行编程技术使其具有更高的性能,具有普遍的研究意义。此外,对超算用户而言,不同架构之间的程序移植带来的编程工作量是巨大的,直接影响了工作效率。通过神威·太湖之光超级计算机的应用优化表明,程序移植工作中编码方式具有较大的模板特性,可以通过概括出一个格式化的模板,然后通过代码转换技术自动生成基础代码。本文针对不同架构下的混合并行编程模型和应用做了如下工作和创新:1.详细研究了基于申威异构众核处理器的采用Athread方式的众核编程,提出一些优化方法和研发一些接口函数,比如使用结构体传参、静态局存变量和从核分区并行等,添加从核间通信接口函数和主从异步混合并行接口函数。经过试验验证,采用上述的优化方法和接口函数对于提高程序性能和易用性有较大的帮助。2.为了解决国产神威环境下众核代码编写工作量大的问题,提高国产异构众核环境下的众核代码编程效率,设计实现了一个可以将核心段的串行代码自动转换为Athread代码的工具。本文基于主程序调用master程序,再由master程序调用slave程序的三层模板程序架构,采用Rust语言进行词法和语法分析,提出一种可以使源程序自动转换为Athread代码的方法。同时,添加一些有助有程序优化的接口函数,进一步提升程序性能和减轻程序移植的代码工作量,最终设计实现了适用于Fortran和C代码到申威众核处理器下Athread代码的转换工具原型系统。经过实验分析,采用该自动转换工具生成的Athread代码相较于人工编写的Open ACC*加速的程序有更高的加速比,特别是对多个核心段进行众核化加速时的加速比相差15%,证明该转换工具具有很好的实用性。该工具能够避免开发人员绝大多数的代码书写错误,极大地提高了开发人员的众核化工作效率。3.为提高采用混合并行编程模型的程序在山河超级计算平台上的执行效率,首先对山河超级计算平台常用的几种混合并行编程模型实现方式和相应的优化方法进行阐述,然后对节点使用的CPU架构进行分析,提出了几种适用于该平台的混合并行运行模式。以此平台为测试对象,采用不同的运行模式对计算密集型和通信密集型两种典型的基准测试程序进行千核和万核规模下的测试,并对其运行性能进行对比分析,结果显示在执行不规则访存的计算密集型程序时每个节点启用8个MPI进程、每个进程采用7个线程级并行所取得的性能最好,相较于单纯使用MPI执行时间降低约20%;在执行不规则访存的通信密集型程序时每个节点采用28进程、每个进程调用2个线程所取得性能会比其他组合方式更优,相较于单纯地使用MPI执行时间降低约10%。该混合并行运行模式对山河平台的用户使用能够提供有用的作业运行参考。
其他文献
随着国家经济的快速发展,人们生活的物质需求也随之增加,对产品的需求也日趋个性化,导致企业生产小批量、定制化的产品越来越多。随之而来的是生产排程越来越复杂,由于缺乏有经验的专业排程人员和高级排程软件系统,导致生产效率低、交货时间慢等问题。高级计划与排程(APS)是以有限能力和可变生产提前期在众多的约束条件下迅速制定合理且具体的车间生产调度计划。但由于传统生产企业各个生产环节相互独立导致APS系统与实
学位
近年来,随着高性能计算的发展,在超级计算机上进行数值模拟逐渐成为解决大规模科学与工程问题的重要手段之一。图形处理器GPU除了在处理图形计算上具有优势外,也逐渐被应用于密集数值计算上。同时,计算流体力学随着数值技术、并行技术和超级计算的发展,已经逐渐成为研究流体力学的支柱之一。格子玻尔兹曼方法是一种基于介观模拟尺度的计算流体力学方法,通过对大量离散粒子的统计分析从而得到宏观状态下流体的运动规律,已经
学位
《公共安全视频监控联网系统信息传输、交换、控制技术要求》(简称GB/T28181-2016标准)是由我国公安部科技信息化局提出的国家安防视频监控标准。该标准的实际推广应用,解决了视频监控联网系统中互联互通的瓶颈问题,破解了视频联网中最关键的通信信令以及媒体格式规范难题,使得安防行业的视频监控联网标准化建设取得了显著进展。然而,在安防系统的建设中,对于GB/T 28181在SIP(Session I
学位
随着生产力的发展和科技的进步,人们的物质需要得到基本满足,与此同时人们的审美能力日益提升,精神需求走向多元化、个性化,重视人与物品、人与人之间的交互,对艺术以及“美”提出了新的要求。在此背景下,认知心理学为各领域的设计师提供了十分丰富的理论依据,因此,将认知心理学的相关理论和研究成果作为交互式书籍设计研究的切入点具有可行性与科学性,有助于提升书籍设计师的美学意识、构思创意和技术手法,对于重新审视书
学位
高性能计算(High Performance Computing,HPC)除了在海洋模拟、气候预测、分子动力学模拟等科学计算领域具有传统优势之外,近年来也逐渐被广泛应用于人工智能、核能模拟、能源勘探、国民经济预测和决策等方面。高性能计算为这些领域带来了更高效、更准确的数据分析和计算能力,已成为当前世界各国争相抢占的科技制高点,是国家综合科技实力的重要标志。高性能计算集群内各个节点通过高速协同工作,
学位
互联网时代,用户从海量的网络服务中选择符合自己需求的服务,无异于大海捞针,而个性化的Web服务推荐技术和方法能够解决这一难题。然而,移动设备的激增导致具有相似或相同功能的服务越来越多,影响了用户体验。因此,用户更感兴趣的是服务的响应时间和可靠性。服务质量(Quality of Service,QoS)是一个衡量Web服务非功能性能的属性,是个性化服务推荐的一个重要标准。但是,现有的基于QoS预测的
学位
随着近年来云计算、人工智能、高性能计算等领域应用增多,数据中心对计算资源的需求水涨船高。除CPU资源外,图形处理器(GPU)资源凭借其高带宽、高主频和优异的并行计算能力等特性成为另一种优质计算资源。由于GPU资源价格普遍较高,使其成为不同计算应用场景中的稀缺性资源,围绕它的调度也成为业内重点研究方向。目前在GPU资源调度上的研究多局限于单一平台,但当前数据中心往往会部署针对不同领域的多种平台,由于
学位
近年来,我国的超算事业迎来了飞速发展,超级计算机已经成为推动科技创新发展的一个重要工具。然而,用户对超算算力的需求迅猛增长,日益涌现的新型计算服务也对计算规模、时延、灵活性等方面提出了严格要求。多超算中心互联出现,能够解决上述问题。多超算中心互联可以整合跨地域超算中心的计算资源和存储资源,能够高效组织跨地域的多个超算为用户提供多样化算力服务,是支撑高质量计算服务的重要途径。但如何在多超算中心互联系
学位
随着网络应用的不断发展,多种新型网络技术相继涌现,极大丰富了用户的用网需求。面向多样化网络应用,不同新型网络协议的适用场景和安全需求各不相同。针对不同网络的差异化安全转发需求,面向特定场景的个性化安全转发机制往往能最大限度的保障数据的机密性和完整性。然而,不同网络协议对安全转发的需求差异较大,传统加密机制无法适用所有新型网络协议,如何实现灵活、可定义的安全转发技术成为当前研究热点。可编程数据平面以
学位
随着物联网、车联网等技术的出现和应用,以内容为中心的命名数据网络(Named Data Networking,NDN)因其具有的网内缓存、高效数据分发等关键技术,已成为新型网络架构领域的研究热点。TCP/IP协议根植于现有的网络设备,使与IP架构通信过程不同的NDN在实际网络环境中部署存在兼容性问题。可编程交换芯片和高级数据平面编程语言的出现,使网络管理员可以自定义网络协议和转发处理逻辑,提高数据
学位