CPU/MIC异构平台下NBC与RRTM算法并行优化技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:ldpjk77
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高性能计算机自诞生以来主要应用在两大领域——数据处理和数值模拟。数据处理方面以数据分类为主,朴素贝叶斯分类算法(NBC)是优秀分类算法之一。数值模拟涵盖许多领域如数值天气预报、核试验模拟、生物基因工程计算等方面。数据分类和数值天气预报以其计算规模大、计算精度高等特点推动高性能计算不断发展。随着众核处理器设备在高性能计算机中应用比例逐步升高,许多应用领域正在加紧进行向众核异构平台计算的迁移。众核异构平台多以GPU为主,MIC作为新一代众核处理器在高性能计算机如天河2号的性能提升方面正发挥越来越重要的作用,但其执行效率、可扩展性、可编程性仍然需要更多的实验。本文深入分析了MIC平台上并行优化方法,对朴素贝叶斯分类算法进行并行优化和测试,进而对快速辐射传输模型开展了并行优化的设计和研究,实现了多层次混合编程模式的并行。主要工作和创新点如下:(1)深入学习了CPU/MIC异构平台下的主流编程模式,研究并测试了offload编程模式下任务加载的工作原理,进行了满负荷进程下offload编程模式的工作机制与效率测试。在MPI、OpenMP编程模型的基础上,深入分析和测试了MIC平台上程序执行特点,为后续的课题研究提供了实验基础。(2)开展了朴素贝叶斯分类算法(NBC)的研究,进行了朴素贝叶斯分类算法基于MIC的优化设计和并行实现。深入分析朴素贝叶斯分类算法工作原理,根据前人的研究工作,针对属性加权方案提出新的权值函数。实现不同改进程度的朴素贝叶斯分类算法的串并行代码,通过德国信用数据集验证,本文改进算法模型比传统朴素贝叶斯分类算法累计分类错误代价减少200个单位,在MIC平台上最高获得14倍加速比,相比CPU最优执行情况获得2.13倍加速比。最后使用Intel VTune Amplifier XE性能检测工具对其访存、带宽、并发度等进行评估。(3)针对快速辐射传输模型(RRTM),进行了CPU/MIC异构平台下的并行优化和实现。采用循环调整、循环合并、循环拆分、向量化、并行粒度调整等方法,对辐射传输计算模型代码优化。以OpenMP方式对程序做并行化,分别以CPU native、MIC native、offload三种模式进行性能测试。其中,CPU native模式和offload模式下均有最高15.7倍的加速比,MIC native模式下最高可获得13倍加速比,但相比CPU端最优执行效率略低。以上工作为传统应用领域遗留程序进行CPU/MIC异构平台下的迁移和并行优化工作奠定了一定的基础。
其他文献
随着计算机的广泛应用和互联网技术的迅猛发展,众多的信息检索系统被开发出来,方便用户获取其感兴趣的内容。数字化的信息资源一方面为人们的工作和生活带来了帮助,另一方面,
Mashup是一种新型的基于Web的数据集成应用程序,利用从外部数据源检索到的内容创建全新的创新式服务,组合多个数据源的内容,创造出增值的服务。Mashup具有第二代Web应用程序
信息技术是一个快速更新和迅猛发展的领域,新技术和新思想层出不穷,系统模式和系统架构日新月异,项目管理、软件工程和系统开发设计方法等也都不断地推陈出新。随着互联网的
科学计算可视化是当前计算机图形学研究的重要方向,它将大量抽象的数据或计算结果用图形或图像形象、直观地表示出来,应用领域十分广泛。医学图像三维可视化是可视化技术在医
地面站是小型无人机飞控系统的重要组成部分,研究小型无人机地面站软件的实现方案、设计开发技术及关键技术问题的解决方法,对设计开发满足工程应用需求的小型无人机飞控系统
大数据时代,人类在生产、生活中积累了大量的数据,但是真正有用的信息却相对较少,急需发展大数据挖掘技术。国家“互联网+”战略的推进,将更为广泛的积累数据,尤其是互联网上
无线传感器网络融合了传感器技术、通信技术和数据处理技术;无线传感器网络因其巨大的应用前景而受到学术界和工业界越来越广泛的重视。本文首先对无线传感器网络进行了概述,
YHSIM是一个功能强大的实时半实物建模仿真软件平台。然而,目前基于YHSIM的模型解算只能在单核上运行,随着系统规模和复杂度的增加,在一个帧周期内要解算的模型越来越多、解
NP问题是计算科学中的经典问题,而所有的NP问题都能在多项式时间内归结为NP完全问题,NP完全问题具有相当的复杂性,为NP完全问题寻找一个多项式时间的解法成为了许多科学家的
随着网络技术的进步,Internet中的实际网络状况已非昔日可比,这不仅体现在网络带宽的快速增加,还体现在网络拓扑的异构化、网络协议的差异化、网络的无尺度化以及服务请求的