基于IBM Cell的非规则运行支持库研究

来源 :北京科技大学 | 被引量 : 0次 | 上传用户:long_drago
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
IBM Cell作为异构多核处理器具有高速的计算性能,但目前并未得到广泛的应用,其主要原因在于其复杂的体系结构导致复杂的编程和编译技术。目前,如何有效地进行异构多核上的并行开发已成为高性能计算领域研究的热点之一。在IBM Cell上的软件开发环境主要是SDK,并有DACS、ALF、OpenMP等编程模型。本文基于图像和信号处理方面的应用,通过与MecuryMCF的对比分析,最终确定使用OpenMP编程模型来进行通用性研究,在不改变原有编程模型的基础上实现编译技术的优化,并设计一套相应的运行支持库。   非规则数据存取是影响处理器计算效率的因素之一,预取技术和软Cache是解决非规则应用的经典方法,鉴于IBM Cell独特的层次存储特点,还存在很大的优化空间。数组私有化是并行化编译中的重要技术之一,SPMD是实现OpenMP数组私有化的重要手段,但是SPMD形式的OpenMP程序却不能直接通过IBM XLC(适用于IBM Cell多核平台的编译器)的编译,为了解决该问题,本文提出了一种IBM Cell多核平台的OpenMP数组私有化技术。该技术旨在充分利用本地存储器,减少DMA通信,集中处理可重用数据的私有化,其主要内容包括:数组私有化分析、数组私有化转换、同步消除与非阻塞DMA操作、扩大数据的可重用作用域。转换后的Jacobi迭代代码的实际测试结果表明,这种基于IBM Cell多核平台的数组私有化技术能够平均提高3%左右的执行性能,对于小规模计算来说性能提高还会更多。在此基础上,通过消除临界区和隐藏Flush操作,调用运行时SPE线程通信API,建立运行时流水模型,可进一步减少通信等待延迟,提高处理器利用率,并保持SPE各线程间的同步和数据一致性。实际测试显示,经过进一步优化的实例其并行执行的加速比得到了明显的提高。
其他文献
性能是软件系统最重要的属性之一。如果系统无法达到预期性能,就要长时间进行调优,甚至导致项目最后以失败告终。目前,针对不同硬件体系结构,并行构件应用程序的执行性能可能差异
研究指出制造执行系统(MES)能有效消除信息孤岛,提高企业的生产效率,减少企业的生产成本,从而使企业在竞争激烈的市场占据优势。因而在企业实施信息化过程中,MES的实施至关重要。
中文分词是中文信息处理的基础,也是其一直存在的基本问题,有着极其广泛的实际应用。可以说,在各类中文信息处理软件(系统)中,中文分词是不可或缺的环节。自上个世纪末,由于互联网
随着互联网技术的快速发展和广泛应用,网络文化正以空前的广度和深度渗透到当代大学生学习与生活的方方面面。不良校园网络文化的传播严重威胁着大学生的价值取向、政治态度、
数据挖掘技术是从大量的、不完全的、有噪声的、模糊的、随机的实际应用的数据中,提取隐含在其中的、人们事先不知道的信息和知识的过程。它是信息技术未来的发展方向。本文依
中医学作为中国特色的传统医学具有重要的社会价值,如何充分利用现代科技手段改造中医的运用方式,完善中医的内部整合,是提高其疗效,扩大其影响力,实现中医现代化的重要措施。将中
随着网络银行、淘宝、支付宝等原本陌生的词汇日益变得耳熟能详,电子商务的蓬勃发展,网上支付、网上转账、网上缴费逐渐步入现代人的生活。与此同时,网上交易的安全性,更具体到身
钻井计算机模拟是用来在室内借助计算机并根据已建立的工程数学模型,模拟并再现钻井施工全过程的一种工程模拟仿真。计算机动态仿真模拟可以克服诸多困难,比如场地限制、经费不
指纹识别技术是一种应用最广泛的生物识别技术。它的核心是指纹匹配算法。人们在长期的研究过程中,提出了多种指纹匹配算法。近几年,隐马尔可夫模型被应用于指纹匹配研究。但
蛋白质是生命活动的重要承担者,它的生物功能和属性是由蛋白质的结构决定的,因而蛋白质结构预测对理解蛋白质结构与功能的关系和生物制药等领域有重要的意义。蛋白质二级结构预