面向动态双模多层次并行体系结构的编译优化技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:try111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无线通信与视频图像处理等应用领域的快速发展对数字信号处理器(DSP)的性能提出了较高的要求。DSP因具有数据处理能力强大、可编程性良好、使用灵活等特点被广泛使用。动态双模多层次并行DSP(Dynamic dual-mode multi-level parallel DSP,DDMP-DSP)是自主设计并实现的一款面向无线通信和视频图像处理的高性能浮点数字信号处理器。DDMP-DSP采用动态双模多层次并行体系结构,基于超长指令字(VLIW)技术支持指令级并行,基于宽字向量单指令流多数据流(SIMD)技术支持数据级并行,基于动态双模技术支持任务级并行。软件工具链对于新体系结构的实用性和性能发挥非常重要。在无线通信和视频图像处理应用中,随着算法复杂程度的提升,应用开发的工作量越来越大,采用手工代码优化的方式无法满足应用开发的需求。因此,开发过程中更多地采用高级语言编译优化的方式进行应用开发,这对高级语言编译器的设计和开发提出了更高要求。动态双模多层次并行体系结构的性能发挥很大程度上依赖于编译器,采用当前已有的DSP编译优化技术无法充分利用DDMP-DSP体系结构的特点并发挥其性能优势。论文针对DDMP-DSP体系结构的编译优化技术展开研究,针对指令级并行、数据级并行和任务级并行三种并行特征,采用建立执行模型、编程模型和代价模型的方式,从调度优化、数据重组以及循环优化等角度设计并实现了三种编译优化技术,有效支持DDMP-DSP体系结构和指令集特征。本文的主要研究成果和创新体现在以下几个方面:1.根据DDMP-DSP体系结构特点抽象出一种动态双模多层次并行执行模型(Dualmode multi-level parallel execution model,DDMPEM),提取出VLIW、宽字向量SIMD和动态双模三个主要执行特征,DDMPEM能够作为研究和开发编译优化技术的基础,指导编程模型和代价模型的实现。设计了一种Kernel Based编程模型(Kernel-based programming model,KBPM),程序员能够方便地利用KBPM进行应用开发,通过支持KBPM,编译器能够识别应用程序中的并行特征,更高效地进行编译优化。提出了一种多层次并行代价模型(Multi-level parallel cost model,MPCM),对指令级并行、数据级并行和任务级并行进行综合考虑,能够对编译优化进行指导。2.提出了一种支持任务级并行的动态双模优化调度技术(Dual-mode optimizing scheduling,DMCOS)。DDMP-DSP体系结构中执行并行任务的向量部件和执行串行任务的标量部件能够在紧耦合模式(Tightly coupled Mode,TCM)串行工作,也能在松耦合模式(Loosely coupled Mode,LCM)并行工作。采用DMCOS优化技术能够确定两种模式的切换时机并实现动态切换。DMCOS对使用KBPM编程模型开发的双模式区(Dual-mode code field,DMC)源代码进行独立任务双模调度(Independent dual-mode scheduling,IDS),或者根据动态双模切换代价模型(Dual-mode switching cost model,DDSCM)进行流调度(Flow scheduling,FS)和双模切换调度(Dual-mode switching scheduling,DSS)。DMCOS能够发掘应用程序中的任务级并行,并将高级语言应用程序转换为满足动态双模执行模型要求的代码。DMCOS能够更好地利用DDMP-DSP的动态双模体系结构特征,开发任务级并行。3.提出了一种支持数据级并行的宽字向量SIMD数据重组编译优化技术(Data reorganization for wide SIMD,DRWS)。DDMP-DSP体系结构中的向量部件包括一组同构的向量运算单元(VE),多个VE可组合支持宽字向量SIMD。DRWS主要包括三个模块:基于多模的数据重组(Data reorganization based on multimodulo,DRMM)模块,宽向量填充数据重组(Data reorganization for wide vector filling,DRWF)模块和分支数据重组(Data reorganization for branch,DRB)模块,这三个模块能够处理多种情况下的数据重组。DRWS能够支持灵活的数据重组,从而在SIMD向量化(SIMDization)时能够更好地匹配VE个数,提高DDMP-DSP中的SIMD计算资源利用率,开发数据级并行。4.提出了一种支持数据级并行和指令级并行的多层次循环优化编译技术(Multilevel loop optimization,MLOP)。MLOP有效地将多面体优化技术、SIMDization编译优化技术、面向VLIW的编译优化技术和运行时编译优化技术结合起来,包括多面体优化模块、子字与超字SIMD向量化模块(S-Ⅱ SIMDization)模块、面向VLIW的循环优化模块和运行时优化模块。使用类迭代编译的方法进行编译优化,综合多种因素,选择合适的循环展开因子并进行循环优化。MLOP能够充分利用DDMP-DSP多层次并行体系结构特点,挖掘程序中的数据级并行和指令级并行。
其他文献
近几年来我国房地产高速发展,房地产过热已经成为公众关注的焦点。本文将具体阐述我国房地产业在派生二元经济环境下的发展态势,并对其提出笔者自己的看法和建议。
在打赢脱贫攻坚战中,产业扶贫作为中央精准扶贫“五个一批”中“发展生产脱贫一批”的重头戏,以“造血式、开发式”扶贫方略,把贫困户植入产业链条之中,围绕某种资源、产品建
开发者在执行软件任务时,需要与软件工件如bug报告、源代码仓库等进行交互,为了获取所需要的信息,也许需要彻底地通读整个工件。然而,从bug报告和源代码中提取有价值的信息是
伴随着互联网的蓬勃发展,传统广告与互联网相结合,出现了互联网广告这一崭新的商业模式。数字媒体的特点使得互联网广告具备成本低、交互性强、可计算等许多传统广告所不具备
本文在建立液压电梯系统模型的基础上,通过仿真和试验发现摩擦非线性是影响液压电梯起动平顺性的根本原因,提出了有效的改善措施。
西安作为古丝绸之路起点,具有厚重的历史文化积淀和丰富的人文资源,在国际人文交流合作中具有得天独厚的条件和重要的地位和作用。文中旨在探讨“一带一路”建设中,西安作为
12月9日至10日,由杭州师范大学(以下简称“杭师大”)和健康杭州建设领导小组办公室联合主办的第二届“健康中国”视角下“健康城市建设”暨“治未病与健康管理”国际论坛在杭师
汽当国际金融危机日益蔓延,众多行业受到波及之时,汽车租赁却逆势起飞,火爆异常,成为业界瞩目的焦点。近日,国内领先的汽车租赁服务商神州租车与中国最大的商业银行一工商银行达成
目的探讨尿激酶与低分子肝素联合治疗下肢深静脉血栓形成的护理,降低并发症及死亡率,提高治愈率。方法 60例下肢深静脉血栓形成患者经彩超确诊后均以尿激酶20~60万U/d加入50
本文主要介绍了液压挖掘机节能控制系统的研究与开发。包括对液压挖掘机在作业过程中的能量损失分析,该控制系统的方案与功能及其节能效果,作用与意义。