基于任务图调度系统的构图优化及航天飞行器应用并行化

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:hxs038
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,面向高性能计算领域的多核、众核处理器飞速发展,为了发掘并最大化的利用多核、众核处理器的计算能力,降低并行编程的难度,提高并行计算效率,任务并行编程模型成为了高性能计算领域的研究热点。AceMesh是能自动发掘结构化网格应用中存在的数据驱动的任务图并行性,以支持多核、众核异构平台的任务并行编程模型,其性能较其它的任务并行编程模型优越。AceMesh任务并行编程模型由AceMesh任务调度系统和AceMesh编译器构成,编译器将指导语句转换为调用底层任务调度系统相关函数的任务并行程序,任务调度系统主要负责任务并行程序的调度执行。为了使AceMesh任务调度系统获得更好的性能,本文实现了其构图阶段的并行化,并对构图进行了进一步优化;然后基于“神威·太湖之光”平台,使用AceMesh指导语句对航天飞行器应用实现了任务图并行化。与“神威·太湖之光”平台已有的OpenACC*编程模型进行了测试对比,测试数据说明了构图优化后AceMesh任务并行编程模型的优越性。具体地,本文在对AceMesh任务调度系统构图阶段进行深入分析的基础上,设计了线程分离、两级数据域划分的方案,实现构图的并行化;采用哈希表地址分治管理、任务分治建边等策略以保证构图的正确性;为确保所有任务的调度执行,引入了任务安全终止检查方法;并行构图方法的实现为构图阶段带来了最高158%的性能提升。从变量从核化、内存池、无后继任务收集等方面对构图进行优化。为验证优化的效果,对航天飞行器应用中的7个热点子程序进行测试,测试数据说明以上优化为构图带来了 500%左右的性能提升。最后基于优化后的AceMesh任务调度系统,使用AceMesh指导语句实现了航天飞行器应用的任务图自动并行化,在该过程中,为提高计算效率,确定了最优的循环分块和执行线程数,设计了采用虚拟地址的任务注册方式;结合“申威26010”异构众核处理器的结构特点,选择了适当的数据传输方式;为适应“神威·太湖之光”平台的从核局存空间64KB的限制,采用了任务内加一维划分方式。航天飞行器应用在“神威·太湖之光”平台上的测试结果表明:采用以上优化方法的AceMesh任务并行编程模型比平台上原有的OpenACC*编程模型性能有近50%的提升。
其他文献
量子密钥分发作为量子通信的一种关键技术,它将量子理论与信息论完美地结合在了一起,可以说具有理论上的绝对安全性。但是,因为那些存在缺陷的实验器件,如不完美的单光子源、低探测效率的单光子探测器等,量子密钥分发的实际应用和理论存在着巨大的差距。这些差距往往表现在通信系统的性能方面,比如密钥生成率和最大安全通信距离等。这差距甚至会引入安全漏洞,从而招致很多针对性的攻击,这些都会对通信过程的安全性产生极大的
明代苏州的图书出版业在宋元刻书的基础上进入了持续的快速发展时期,特别是明万历中后期至明崇祯末,苏州各类刻书活动频繁、名家精品辈出,这一时期的小说插图刻绘风格也较其他地区而言以精雅而著称。晚明苏州坊刻小说插图其图像表现的推陈出新不仅体现了画家、刻工、文人、书商等插图创作者的紧密配合,也折射出了作为全国商业中心之一的古苏州其所蕴含的融合、创新意识。依附于故事文本但又表露出绘刻者主观思考的晚明苏州坊刻小
生态化学计量学是研究生物有机体化学元素组成和生态系统能量平衡的科学,其研究尺度可以细致到分子水平,也可以扩大到区域和全球水平,实现化学计量覆盖分子、细胞器官、个体、群落、生态系统、区域和全球等不同尺度。本文以非结球意大利耐抽薹非结球生菜为实验材料,首先,在中等肥力水平下进行土培试验,利用叶片叶龄累计速率快慢对生菜生长阶段进行划分;其次,在中、高两较优肥力水平下进行土培试验,对不同生长阶段的生菜叶片
走神(Mind Wandering)是指将注意力从当前从事的任务转移到与当前任务无关的事情中去,是一种不自主的思维迁移现象,对我们日常的学习和工作效率会产生较大影响,而如何减少课堂走神,提高学生参与课堂的积极性、提升学生学习效率一直是学生、家长、教师特别关心的一个问题。尤其是高一学生,从义务教育阶段进入非义务教育阶段,对知识掌握的宽度、广度、深度要求更高,导致学习压力变得更大。睡眠节律是指由“睡眠
智能电网是建立在先进的通信、计算、传感和控制技术上的,以信息化、自动化、互动化为特征,以实现电网可靠、安全、高效、经济、实时可控可通信等等目标的未来电力网络。它充
当前我国扶贫开发工作正处在攻坚拔寨冲刺期,产业扶贫作为一种重要的扶贫手段,加快了脱贫目标的完成进度。产业发展是一种经济活动,产业扶贫则是一项需要全社会共同努力才能圆满完成的任务。我国产业扶贫项目遍地开花,在取得一定成效的同时,一些问题也在不断凸显。本文以参与式治理理论、生产要素理论等为理论基础,以文献研究法、访谈法、问卷调查法为主要研究方法,聚焦产业扶贫中存在的问题。研究思路是产业扶贫中多元主体参
随着计算机与摄像机技术的发展,基于图像的古建筑三维重建已广泛应用于数字考古、智慧城市建设等方面。但由于古建筑结构精巧、采集环境复杂等问题,基于图像的古建筑三维重建结果精度较低、鲁棒性较差。特征匹配作为基于图像的三维重建过程中的一个关键步骤,其匹配精度和效率直接影响古建筑三维重建的结果。本文结合古建筑图像特征间的几何结构信息,采用网格多密度聚类分析方法,对古建筑图像特征匹配中存在的误匹配率高、匹配鲁
地学旅游是科学旅游的一种,其旅游纪念品应具有科普意义,并能唤起人们对地学旅游美好回忆.由于地学旅游欣赏对象的特点,旅游纪念品并不能以地质材料为原料.近年来,旅游纪念文
对于大部分出现倾斜的建筑物,只要其整体性和主结构未受严重的影响,对该建筑物进行顶升纠倾是解决问题的有效方法,而托换节点的设计和施工是确保顶升纠倾工程安全的关键。以往框架柱的各种托换形式,大多数都应用于方形柱,而且一般采用钢筋混凝土托换节点。昆明某顶升纠偏工程中需要对圆形框架柱进行托换顶升,并采用了一种新式的钢结构托换节点——粘钢套筒托换节点。本文采用ABAQUS软件对该托换节点进行建模,并通过数值
随着集成电路技术的发展,面向微米级微生物检测的便携式高精度显微成像设备已经成为相关领域的研究方向。在实际使用中此类设备可以解决传统微生物检测设备的笨重、昂贵、不能即时检测等缺点,同时与传统微生物检测过程相比将会省去样品送检和简化样品处理的过程。为了方便普通用户使用便携式微生物检测设备并且解决设备的存储问题,论文为便携式微生物系统提供了云存储与共享系统。论文的主要工作有以下几个方面:一是分析了便携式