粗粒度可重构计算架构及其映射算法的协同优化研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:willian1019
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗粒度可重构处理器(Coarse-Grained Reconfigurable Architecture,CGRA)作为计算加速器的一种理想选择,具有比专用集成电路更高的灵活性,又具有比通用处理器更高的性能,常被用来加速计算密集型的应用,而其架构的优化和高效映射算法的研究则是可重构领域的研究热点。传统的CGRA研究在进行架构设计时没有考虑架构对编译性能的影响,而传统的映射算法研究则忽视了算法对硬件资源的需求,导致整体的面积效率和功耗效率不高。针对这一问题,本文基于软硬件协同设计的思想,选用合理的架构来指导映射算法的设计,又通过分析编译结果来指导架构参数的制定,最终形成了一种快速高效的映射模型。本文主要的研究内容和成果如下:1、从效率的角度出发,探索CGRA的设计空间。本文重点研究了粗粒度可重构处理器的构成,包括处理单元、计算阵列、互连网络、寄存器堆和配置机制,介绍了上述组成部分的不同设计形式,并阐明了不同的设计对性能和硬件成本的影响,提出了一种兼顾性能和效率的CGRA结构。2、为了解决现有循环映射技术或者耗时长、或者性能差的问题,本文提出了一种快速、高性能的循环映射算法。该算法采用出度调整和同级调整技术以支持复杂数据流图的映射;利用路由共享和存储器感知的技术来减少数据流图的节点数量,从而实现了映射前的优化;结合贪心思想和回溯算法提高了映射阶段的速度并保证了映射的性能。3、设计了自动化的CGRA建模工具,在编译器中集成了本文的映射算法。建模工具能够为CGRA基础结构及其扩展结构生成RTL模型。编译器提供了循环核心提取、数据流图构建、调度和映射这一完整的CGRA循环映射编译流程。这些工具为CGRA架构和映射算法的研究提供了便利和实验条件。4、对本文提出的算法以及架构进行了综合的评估。结果显示无本地寄存器堆架构的面积为0.17mm~2,功耗为7.53mW,在本文映射算法的支持下,相比于带本地寄存器堆的架构获得了17%的面积效率上的提升,以及44%的能效提升。本文映射算法还具有285倍于REGIMap的编译速度,却达到了同样的性能,验证了本文映射模型具有快速和高效的特点。
其他文献
西气东输管道是我国天然气重要战略管道,国家对管道的安全运行以及发生事故时快速的维护抢修反应都有极高要求。同沟敷设的通信光缆作为管道信息传送的主要载体,是保障西气东
~~
会议
未来战场要求武器系统能够适应信息化、精确化、多功能化的趋势,对多模可调战斗部的需求日渐增强,作为其机理的重要组成部分,多破片毁伤元的成型研究一直受到学者广泛关注。
随着我国高速列车的提速,列车系统的动态性能愈发复杂,特别是作为车辆主要动力源和牵引力主要传递部件的传动系统。在列车运行过程中,转速波动、驱动装置各部件振动等现象普
20CrMnTi钢作为一种典型的低淬透性钢,因其韧性好,可焊性能优良,以及淬火后切削能力好等优良性能,被广泛地应用于汽车的传动部件。零件的失效形式是在交变应力的循环作用下在
环形桁架天线作为当前最具应用前景的一种空间大型可展天线,受到了研究人员的广泛关注。环形桁架天线在太空无(微)重力条件下顺利平稳地展开,是保证天线在服役期限内可靠工作
从长期施用多菌灵的土壤中分离获得两株菌,分别命名为SD-4和Y2,根据生理生化特征以及16S rRNA基因序列的比对结果,分别将它们鉴定为Mycobacterium sp.(GenBank accession no.
目前,许多大型软件项目采用众包测试平台接收测试人员提交的测试报告并对根据报告内容对软件系统进行更新与维护。在该平台上,测试人员在测试报告的提交和评价中的表现差异表明测试人员对于软件测试的贡献不一,并且测试人员提交的测试报告对软件系统更新维护的影响也存在较大的差异性。如果能够合理评估众包测试平台上测试人员的贡献度并识别高影响力测试报告,将能够提升测试人员工作热情并提高测试效率。然而,随着软件项目中测
Bt(Bacillus thuringiensis)蛋白与昆虫中肠 BBMV(Brush Border Membrane Vesicles)上特异性受体蛋白的结合是其杀虫过程中的关键环节。只有对Bt受体蛋白进行系统的研究才能
随着E级计算的兴起,传统基于光传输、电交换的互连网络,存在的集成度低、功耗高、可靠性差和带宽难以升等问题,已经逐渐成为下一代高性能计算机发展的瓶颈。与此同时,随着硅