基于PMU和Android应用的龙芯CPU性能评估工具设计

来源 :东南大学 | 被引量 : 2次 | 上传用户:icefire870723
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Android系统是目前最主流的移动终端操作系统,软硬件开发人员在设计优化时需要获取CPU在面向Android应用运行行为和硬件的性能参数。目前基于ARM架构这类工具很多如ARM公司推出ARM Streamline性能分析器,但对于非ARM架构的龙芯CPU架构,则非常缺乏相应的性能分析工具和方法。因此,针对龙芯CPU设计一套面向安卓应用的性能测试方法对于优化系统性能,推动国产CPU的应用,是非常有意义的。性能监测单元PMU(Performance Monitoring Unit,PMU)能保证额外开销低和目标应用执行干扰的条件下在线记录程序运行时的微架构事件特征。本文在参考了已有性能分析工具VTnue、Perf以及ARM Streamline的实现原理后,结合龙芯2H平台的硬件特性,采用龙芯2H CPU内嵌的PMU,通过全系统采样方式设计并实现了一款面向安卓应用的性能测试工具。该工具主要分为三个模块:数据采集模块,数据采样控制模块,数据分析模块。其中数据采集负责控制性能计数器,采集应用运行中的硬件事件信息;数据采样控制模块负责配置采样的事件类型、数据的存储方式;数据分析模块负责分析收集的抽样数据。论文设计的性能测试工具可以在安卓应用运行时精确统计出每个线程的对应处理器硬件事件数目如:如cpu时钟数、分支预测缺失次数、指令数以及Cache缺失次数等事件,以及每个线程切入时间,切出时间,运行时间等。由于龙芯2H平台已有工具perf在线程统计不区分相同ID的线程、且操作繁琐。我们在进程级对比了本文所实现的性能测试工具与龙芯2H平台已有工具perf的精度。其中0xbenchmark测试结果得出cpu时钟数最大误差为1.11%,分支指令数最大误差为1.41%,一级指令缓存未命中数为0.99%。
其他文献
作为当前研究和应用最广泛的荧光材料之一,荧光纳米材料其制备方法多样,条件简单,且具有优异的发光性能和低毒性。碳量子点或碳点自首次发现以来,已经广泛应用于医学成像、生
氮氧化物(NOx)是造成酸雨、光化学烟雾等环境问题的主要污染物,脱硝技术中H2协同C3H6选择性催化还原NO技术因能有效提高反应低温活性而极具潜力。本文制备了球状Ag-CeZr催化剂,
背景:Salehi在2000年通过酵母双杂交系统发现了NRAGE,它能够与p75NTR相互作用,属于MAGE(黑色素瘤相关抗原基因)-D亚族的成员。此外,因为它又能够与转录调控因子如Dlx5等相互
随着信息时代的发展,各种数据量爆发式增长,人们对存储器的要求也越来越高。在经历了从磁存储向闪存迭代的过程后,相变存储器(PCRAM)被认为是最具潜力取代闪存的下一代存储技术之一,但热串扰导致的可靠性问题等制约了PCRAM存储密度的提升,使得其迟迟未能大规模商用化。近年来,基于三维多层堆叠的3D XPoint存储器在同等工艺尺寸下可实现更高的存储密度,成为备受关注的下一代存储器。但是,3D XPoi
有机卤化物是天然产物、医药农药,功能材料等化合物的重要组成部分。此外,作为合成复杂化合物的主要前体,有机卤化物常用于过渡金属催化的偶联反应,以及金属化和亲核取代等传
景德镇是世界闻名的千年瓷都,由于陶瓷文化氛围,一直以来景德镇都有很多的陶瓷艺术工作者,有一些大家耳熟能详的陶瓷艺术大家,也有一些默默无闻但是一直为景德镇陶瓷艺术做贡
本文主要研究多债券组合的信用风险计算问题,模型框架采用credit metrics框架。模型整体分为三部分:第一部分是依据历史公司债券评级数据进行信用转移矩阵估计,第二部分是各
加强对外观设计专利的保护是完善知识产权保护制度的重要环节,检索是保护外观设计专利的关键手段。外观设计专利检索系统主要是一个基于内容的图像检索系统。由于基于内容的
一、研究背景与目的肝脏是体内进行代谢的重要器官,主要功能是对内源性物质及外源性物质(包括摄入的食物,药物)进行生物转化:包括氧化还原,水解,结合等一系列化学反应,物质的
偏振光在浑浊介质中传输会改变其偏振态,从而带来丰富的偏振信息,是实现各类偏振技术的关键。因此,研究偏振光在浑浊介质中的多次散射特性具有重要意义。通过仿真实验和相关