基于“神威·蓝光Ⅱ”超级计算机的特征线方法并行优化研究

来源 :齐鲁工业大学 | 被引量 : 0次 | 上传用户:doublexiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算机技术的不断发展和升级,能够通过聚合结构,使用多台计算机和存储设备进行计算,称之为高性能计算。高性能计算已经成为各个领域进行科学研究的必要条件,例如,在物理仿真、工程设计、数据分析、人工智能等研究领域。随着处理器多核和众核技术的发展,高性能计算机也拥有了更多的硬件计算资源。但是,单纯的硬件提升不能带来同比例的软件性能提升。因此,并行计算成为了高性能计算领域研究的重点之一。为了提高程序的计算效率,研究人员致力于实现程序的并行计算,从软件层面对高性能计算机的硬件进行匹配。并行计算研究对于推动科学技术的发展和进步具有重要的意义。“神威·蓝光Ⅱ”超级计算机是我国自主研发的高性能计算机,也是神威系列最新一代的超级计算机,其峰值性能可以达到3.13 PFLOPS。它不仅能够加速计算任务的执行速度,还能够提高计算资源的利用率,同时降低了能源消耗和成本。目前广泛应用于科学计算、人工智能、大数据分析等各种领域。随着核能技术的发展,反应堆物理计算对计算精度和速度的要求越来越高,使用高性能计算机进行反应堆模拟计算已经成为必然选择。特征线方法(MOC)由于可以处理任意的几何结构,是目前公认的、针对核能全堆芯中子输运计算模拟的首选方法。本文基于申威众核处理器和“神威·蓝光Ⅱ”超级计算机,提出了一种细粒度的、通用的两级并行优化策略,包括线程级并行优化和进程级并行优化。在线程级并行优化中,提出了作业流水线优化、从核负载均衡优化和I/O优化方法;在进程级并行优化中,提出了一种从软件到硬件的映射方法,该方法可以充分利用神威超级计算机的硬件,提高计算效率和数据传输效率。本文首次将Open MOC程序在神威系列超级计算机上进行了移植和并行优化,丰富了神威系列超级计算机的应用生态。与原程序相比,线程级并行优化可实现高达5.4倍的加速比,进程级并行优化可实现高达4.8倍的加速比。最后,两级并行化可以实现高达18.6倍的加速比。此外,我们实现了Open MOC程序在“神威·蓝光Ⅱ”超级计算机的3750个进程上运行,并且具有良好的强、弱可扩展性。
其他文献
随着近年来云计算、人工智能、高性能计算等领域应用增多,数据中心对计算资源的需求水涨船高。除CPU资源外,图形处理器(GPU)资源凭借其高带宽、高主频和优异的并行计算能力等特性成为另一种优质计算资源。由于GPU资源价格普遍较高,使其成为不同计算应用场景中的稀缺性资源,围绕它的调度也成为业内重点研究方向。目前在GPU资源调度上的研究多局限于单一平台,但当前数据中心往往会部署针对不同领域的多种平台,由于
学位
近年来,我国的超算事业迎来了飞速发展,超级计算机已经成为推动科技创新发展的一个重要工具。然而,用户对超算算力的需求迅猛增长,日益涌现的新型计算服务也对计算规模、时延、灵活性等方面提出了严格要求。多超算中心互联出现,能够解决上述问题。多超算中心互联可以整合跨地域超算中心的计算资源和存储资源,能够高效组织跨地域的多个超算为用户提供多样化算力服务,是支撑高质量计算服务的重要途径。但如何在多超算中心互联系
学位
随着网络应用的不断发展,多种新型网络技术相继涌现,极大丰富了用户的用网需求。面向多样化网络应用,不同新型网络协议的适用场景和安全需求各不相同。针对不同网络的差异化安全转发需求,面向特定场景的个性化安全转发机制往往能最大限度的保障数据的机密性和完整性。然而,不同网络协议对安全转发的需求差异较大,传统加密机制无法适用所有新型网络协议,如何实现灵活、可定义的安全转发技术成为当前研究热点。可编程数据平面以
学位
随着物联网、车联网等技术的出现和应用,以内容为中心的命名数据网络(Named Data Networking,NDN)因其具有的网内缓存、高效数据分发等关键技术,已成为新型网络架构领域的研究热点。TCP/IP协议根植于现有的网络设备,使与IP架构通信过程不同的NDN在实际网络环境中部署存在兼容性问题。可编程交换芯片和高级数据平面编程语言的出现,使网络管理员可以自定义网络协议和转发处理逻辑,提高数据
学位
随着未来计算机微处理器朝着众核处理器方向的发展,以及大规模机群的不断出现,基于异构平台的混合并行编程在今后的大规模并行应用中必将成为主流。在多核体系上,传统的并行编程技术并不能高效地适用,针对多核集群的特殊体系结构,研究相应的编程模型和并行编程技术使其具有更高的性能,具有普遍的研究意义。此外,对超算用户而言,不同架构之间的程序移植带来的编程工作量是巨大的,直接影响了工作效率。通过神威·太湖之光超级
学位
随着互联网的不断发展,大数据、人工智能、5G正在兴起并方便着人类生活的各方各面,数据中心作为信息的载体如雨后春笋般发展起来,呈现数量规模同时上升趋势。科技的发展使发热元件单位面积热流密度不断增大,对数据中心的冷却系统带来了巨大的挑战。传统的风冷、水冷散热方式难以满足高热流密度数据中心的散热需求,浸没式相变液冷以其低能耗、高效率、噪音小等优势受到人们的青睐。浸没式相变散热系统主要是将发热元件浸泡在液
学位
随着信息技术的飞速发展,实时控制、沉浸式交互、边缘计算等应用领域提出了低时延、低抖动的确定性传输需求,未来网络中将会衍生出更多毫秒级乃至微秒级时延的业务需求,在这些对数据传输具有高要求的场景的需求驱使下,数据的实时可靠性传输变得极为重要。然而传统以太网采用的尽力而为分组转发机制具有长尾时延效应,难以满足上述时间敏感业务场景中的有界低时延需求。时间敏感网络(Time-Sensitive Networ
学位
随着5G通信和物联网技术的快速发展,终端设备产生的大量关键数据通过网络传输至算力更强的计算终端。由于终端设备受限于紧张的计算资源、有限的存储空间等问题,传统的密码技术部署方案无法很好地部署在终端设备上。RISC-V指令集因为其短小精悍的架构和模块化的的设计理念成为专用领域架构的首选。通过向基于RISC-V架构的通用处理器中添加密码运算单元,使处理器在不失通用性的同时,还获取了较高的密码运算性能。本
学位
随着互联网技术的快速发展以及大数据、云计算、人工智能、物联网等新兴技术的出现,全球数据总量出现爆发式增长,海量的数据被产生、传输、存储和计算。为了满足用户日益增长的网络带宽需求,以太网迎来飞速发展。早在2006年,IEEE802.3ba提出了100G以太网标准,以太网迈入百G超高速时代。从2006年首次提出了100G标准,到2020年第一个800G规范的出现,以太网日新月异的传输速率推动了物联网、
学位
近年来,容器因为其轻量、灵活和快速部署等特点被业界广泛应用,成为云时代的基础虚拟化技术。然而,容器的资源隔离机制、内核共享特性以及其镜像源的开放态度在便捷用户的同时也埋下了巨大的安全隐患。随着新型容器漏洞、容器逃逸方法、针对容器的攻击手段等容器安全问题的逐渐揭露,业界为保证自身业务的安全与稳定对于容器应用产生恐慌,容器安全恐成云时代来临的巨大阻碍,针对容器场景的入侵检测技术研究迫在眉睫。系统调用轨
学位