并行程序解析性能模型的自动生成技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：flysnake

【摘要】

：

随着人类认识自然和改造自然需求的增长，大规模高性能计算已经成为人们生产生活中不可缺少的研究方法。高性能计算被广泛应用于气象预测、航空航天、核试验等重要领域，实现科学

【作者】

：

王学惠

【机构】

：

哈尔滨工业大学

【出处】

：

哈尔滨工业大学

【发表日期】

：

2014年期

【关键词】

：

高性能计算并行程序性能评测性能模型解析方法 LLVM

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着人类认识自然和改造自然需求的增长，大规模高性能计算已经成为人们生产生活中不可缺少的研究方法。高性能计算被广泛应用于气象预测、航空航天、核试验等重要领域，实现科学计算的程序一般需要在成千上万个处理器上并行运行，程序自身的性能和程序与平台的匹配程度都会对运行性能和成本产生显著影响。为了改善高性能计算程序的性能，为其选择匹配的运行平台，评测高性能计算程序的性能成为研究人员的又一研究方向。高性能计算领域的科学计算程序一般是单程序多数据（Single Program Multiple Data，SPMD）形式的并行程序，因此本课题的主要研究内容是，以SPMD形式的并行程序为研究对象，设计并实现并行程序解析性能模型的自动生成方案。评测程序性能的常用方法有实际测量法、基准测试法、性能模拟法和性能模型法，每种方法都有其适用的范围和局限性。通过分析这些评测方法的优缺点，选择以性能模型法为基础建立解析性能模型自动生成方案。传统性能模型法具有人工计算量大、需要使用者深入理解程序的缺点，本课题通过在计算部分借助分析工具和在通信部分引入函数封套技术规避了这些缺点。在将性能度量角度确定为程序执行时间的基础上，对并行程序解析性能模型的自动生成问题进行了描述。通过分析SPMD程序的特征，分别将程序的计算部分和通信部分进行了数学抽象，建立了描述时间性能的模型，将平台相关的参数单独处理，为跨平台性能预测提供了前提。设计了完整的性能模型自动生成方案。以目标应用程序的LLVM（Low LevelVirtual Machine） intermediate representation（IR）文件为分析对象，这在很大程度上降低了对应用程序编程语言的限制。对于计算部分，使用辅助分析工具LLVM实现热点基本块执行次数和基本算术操作次数的自动统计，对于通信部分，通过重构应用程序的循环结构确定通信函数的主循环体，使用文本解析的方法获得主循环体的执行次数和内部的通信函数信息，最后通过曲线拟合的方法确定热点基本块执行次数和主循环体循环次数的变化规律，生成应用程序的性能模型。将解析性能模型自动生成方案应用于CGPOP（Conjugate Gradient ParallelOcean Program），生成了以运行规模为变量的性能模型。使用该性能模型评测可以测量的程序性能和预测不可测量的程序性能，并与实际测量的程序性能进行比较，从评测效果和预测效果两个方面证明了性能模型的有效性和准确性。

其他文献

足球视频中基于镜头分类的关键帧提取

随着多媒体技术、数字电视和网络技术的发展，用户对视频获取的渠道越来越多，现有的基于文本的管理方法已经不能满足用户需求。为了对海量视频数据实现有效的组织管理和快速浏览

学位

足球视频镜头分类关键帧提取视频处理

基于嵌入式技术的网控战车模型系统的设计与实现

数字实景游戏是最近提出的一类实景游戏。传统的实景游戏一般采用彩蛋作为道具,以彩蛋在玩家身上留下的痕迹作为评判的依据,这大大降低了游戏的价值。数字实景游戏通过整合通

学位

无线局域网嵌入式系统ARM网控战车模型系统设计存储过程

基于ISS的可编程实验系统仿真模型研究

随着计算机技术和仿真技术的发展,建立虚拟实验室以取代传统的物理实物实验室已经成为可能。相比较而言,虚拟实验室在成本控制、易用性、可维护性等方面都有着无可比拟的优势

学位

仿真模型可编程指令集仿真器虚拟实验

基于书网融合客户端传媒系统研究

近年来，随着移动通信技术的迅速发展，整个移动互联网行业呈现蓬勃的发展态势。移动客户端作为接入移动互联网的最方便的方式，与PC客户端和TV应用进行聚合，以虚拟化为基础，将传统的

学位

书网融合客户端传媒系统移动互联网在线教育可行性测试

基于精彩度的足球视频精彩镜头提取方法

近年来，足球视频处理与检索技术发展越来越迅速，已经成为一个研究热点。　　虽然足球视频持续时间长，包含的镜头很多，但是观众关注的只是一些比较精彩的比赛镜头。如何从足球视

学位

足球视频处理检索技术关键帧分类

动态免疫算法在网格任务调度中的应用

网格计算是近些年来国际上兴起的一项重要技术,目标是要实现网络虚拟环境下高性能的资源共享与协同工作。任务调度是网格计算中的一项关键技术,目标是要在满足一定的性能指标

学位

网格计算任务调度动态免疫算法GridSim

数据流环境下的聚类挖掘研究

作为数据挖掘的重要方法之一,聚类是对自然的或抽象的对象自动地进行分组,使其成为由类似对象组成的多个类(簇)的过程。由于其在现实生活中的广泛应用,数据挖掘领域在研究方

学位

数据流聚类网格加权网格

EXT2文件系统微型化改造

EXT2（第二代扩展文件系统）是早期GNU/Linux操作系统标准文件系统,是一个功能强大、易扩展的、性能上进行了全面优化的、支持长文件名的文件系统。它是Linux文件系统类型中使用

学位

文件系统虚拟系统操作系统嵌入式系统实时系统

基于XYZ/E的UML2.0顺序图的时序逻辑语义描述研究

在统一建模语言(Unified Modeling Language)UML2.0规范中，模型的语法是通过元模型以类图形式定义的，静态语义用对象约束语言(Object Constraint Language)OCL描述，动态语义直接

学位

形式语义UML2.0顺序图XYZ/E并发控制流图

BitTorrent下基于文件可获得性的节点选择算法研究

对等计算(P2P)相关的应用在因特网上非常成功。BitTorrent系统是目前因特网上最大的P2P文件共享系统,据统计2004年,BitTorrent协议相关的流量占了因特网总流量的35%。BitTorr

学位

对等计算文件共享BitTorrent协议

并行程序解析性能模型的自动生成技术研究

其他学术论文