基于LLVM的并行程序自动性能测量的研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:honest1988li
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机与社会各方面的融合越来越密切,计算机被越来越多地用来解决各类科学问题。这些应用的特点在于需要对海量数据进行高效运算。为了解决海量计算的问题,并行计算被提出,这是一种通过多台处理机联合求解问题的方法,而这些被联合起来的处理器构成了超级计算机。然而,随着并行程序与超级计算机结构的日趋复杂,并行程序的实际运行性能与期望性能的差距开始显现。尽管近年来各种超算平台的计算能力迅猛发展,但并行程序的机器利用率却难以提升。这说明并行程序的性能有很大的潜力可以被挖掘。准确地测量并行程序的性能可以有效地分析程序的运行状态,有助于发现性能瓶颈,从而提升运行效率。但是,由于并行程序的复杂性、编程语言的多样性、个人编程习惯的差异性以及高性能计算平台的异构性,准确的测量程序的性能变得非常困难。此外,性能测量不仅需要统计程序的运行性能,还要对程序的运行信息进行高效存储与定位,这些步骤会增加性能测量工具对程序运行的开销,影响程序性能特征,并影响性能测量结果的准确度。因此,如何实现低开销、高准确度的性能测量是一项艰巨的挑战。本文提出了一种低开销、高准确度的性能测量工具:LPerf。它实现了在低开销的情况下,获取程序中准确的函数运行信息,并可以快速且准确定位计算热点函数与通信热点函数。本文主要贡献如下:·提出了一种预处理方法,从而减少LPerf在运行时对源程序造成的开销。此外,LPerf还实现了粒度可调的自动插桩,使用户可以平衡测量的精度与开销。·提出了一种聚合的父子调用关系,使得LPerf在运行期间可以实现高效地定位函数之间的调用关系。聚合的父子调用关系可以减少了时间开销,并且采用红黑树作为数据结构存储调用关系从而进一步加速定位。·提出了测量感知的函数运行时间计算方法,消除了 LPerf自身运行时间给测得的函数运行时间所造成的误差,从而实现对函数运行时间的精确测量。本文在一个被广泛使用的基准程序和一个大规模科学计算程序上验证了LPerf的性能。实验结果表明,LPerf在较低开销的情况下,性能测量结果达到了较高的准确度。测量结果的误差率最低降至0.02%,开销占比最低降至1.6%。相较于对比对象,LPerf的精度、准确度和开销都达到了较好的水平。
其他文献
气象条件是人民日常生活和农业生产的重要影响因素,随着各类气象灾害的频繁出现,人民群众的生命财产安全受到了严重威胁。因此,气象监测和预测变得越来越重要。随着传感器技术和通信技术的进一步发展,气象监测从人工记录数据逐步转为自动化记录和管理数据。气象数据的准确监测是开展气象工作的基础,也是准确预测各种突发性灾害天气的依据。目前市场上的气象监测系统,往往存在网络化能力不高、自动化能力欠缺以及设备部署复杂等
序列推荐(Sequential Recommendation)根据用户的历史交互序列预测用户的下一次交互物品,由于序列中复杂的物品依赖以及用户的多方面兴趣,想要准确预测用户的下一次交互的物品十分困难。现有的工作将序列中的每一个交互物品视作一个兴趣单元,并应用了最新的深度学习技术来学习到用户兴趣的统一表示。虽然这些方法在实验中取得了较好的效果,但它们仍存在一些缺陷:1)一个向量不足以表示用户多方面的
呼吸状态可以反映一个人的生理和心理状况,有助于相关疾病的筛查诊断和预后评估。本文对非接触式呼吸状态评估方法展开研究。具体来说,利用视觉传感器进行呼吸信号提取,结合多种信号处理技术对原始信号进行处理,借助机器学习技术对呼吸状态进行分类,并以此为研究框架,搭建了两套非接触式呼吸监控设备,深度研究人体向前走动时识别深呼吸的方法。主要研究内容及创新如下:(1)搭建基于彩色相机和标志物追踪的呼吸监控系统,结
在大数据时代,数据已成为比肩石油的基础性关键战略资源,正在颠覆全球社会的发展模式。数据流通是释放数据价值的关键环节,数据交易系统的建立是促进数据流通的重要举措。数据交易系统帮助卖方数据流入买方,增加数据的流动性,帮助释放数据价值。随着《数据安全法》等相关文件的发布,全社会对于数据安全和数据隐私的需求越来越高,对传统的数据交易系统提出了保护数据隐私等新要求。目前的数据交易系统存在三个问题:1.二次转
以图结构表示的数据广泛存在于各类应用场景,大规模图分析挖掘需要利用分布式图处理系统。图处理算法一般都是迭代的,且执行时间长。在此过程中,系统中节点出现故障是常见的现象。通常,分布式图处理系统利用检查点来处理故障。在正常执行期间,系统需要周期性地写入检查点。特别地,在写入检查点时,一些系统会暂停计算过程,即阻塞式写检查点。显然,这种阻塞式写检查点方法带来了额外的运行时开销。与此不同,非阻塞式写检查点
近年来,越来越多的计算机视觉系统被广泛地应用于人们生活中的方方面面,从日常生活到国家安全,计算机视觉系统起着重要的作用。这些视觉系统往往会受到部署环境的影响。雾是一种常见的恶劣天气,大量颗粒悬浮在大气中,导致视觉系统捕获的图像严重受损,出现部分信息丢失、纹理细节模糊、颜色失真等问题,这些问题会直接损害视觉系统的性能。因此,如何快速有效地对雾天降质图像进行复原,提升图像质量,消除雾霾天气对视觉系统的
在乡村振兴及美丽乡村建设的不断推进下,农村环境治理的发展现状落后于农业农村现代化发展的步伐,早已不能满足时代发展的新需求。“十三五”时期是我国农村环境保护的攻坚期,崇明在“世界级生态岛”战略目标的推动下,新建1.7万余座农村生活污水处理设施;但在长期运行过程中,大部分处理设施出水总氮、氨氮、总磷不达标,出水C/N较低,可生化性较差。本文通过实地调研,收集、计算、分析崇明农村户均人口、排放系数、处理
在大数据时代,随着电子商务交易和即时通讯平台的快速发展,网络上的短文本数据日益增长。所以,从这些数量巨大的短文本数据中提取出宝贵的知识是十分有必要的。短文本分类是自然语言处理领域的一个经典问题,它基于篇幅较短的文本数据学习其深层语义表征,同时用于分类任务。此类文本的长度通常较短,包含的有效信息较少且文本的口语化严重,具有极强的不规范性。所以,本文针对短文本特征稀少以及不规范的特点,从扩充短文本篇幅
自从进入互联网时代,如何保护信息安全就成为一种常态性的话题。密码在信息安全保护中尤为重要,网络数据的传输、数据库密码保护等都是通过密码算法来保护,一个好的密码算法能极大程度地保护我们想要保护的信息。密码算法主要可以分为对称密码和非对称密码,我们在选择密码时要考虑不同的情境,来决定是选择非对称密码还是对称密码。例如对加密解密的效率要求是否比较高,加密和解密密钥是否相同等。另外,选择密码时衡量效率和安
需求分析在软件工程中处于非常重要的地位,为设计起指导作用,是软件工程中的一个关键过程,需求分析的正确性直接关系到所开发系统的效率和质量。目前需求工程也已经研究出一系列需求分析的方法,金芝等提出的基于环境建模的需求工程方法(EBRE)被广泛应用,该方法显式地对交互环境进行建模,并基于环境模型为需求获取和分析提供系统的过程和需求模型。如何验证EBRE需求模型的正确性是备受关注的问题之一,目前存在相应工