面向全分布式VLIW结构的功能单元互连技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:sody520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,传统驱动单处理器计算性能提升的技术逐步接近极限,但应用的发展对处理器性能的追求是无止境的,基于此,众核体系结构成为越来越多的研究人员热衷的对象。由于当前体系结构的发展面临诸如线资源昂贵,能效要求高的挑战,要想设计出成功的众核处理器,必须更加精细化小核的设计。而超长指令字结构作为一种高性能、低能耗的技术,更是多数处理器选择的结构。因而论文选取了面向全分布式VLIW结构的功能单元互连技术作为研究的对象。本文在深入研究VLIW相关技术的基础上,提出了对原有功能单元互连结构的改进和相关编译技术的优化:1.提出了功能单元部分互连设计。通过分析媒体程序的数据供给特征,对功能单元全互连网络进行削减,提出了对称式和非对称式的两类部分互连结构。2.进行了针对部分互连的编译优化。分析了通信调度在共享互连体系结构编译中所发挥的重要作用,针对部分互连结构的特点,在操作数优先级和功能单元分配时采用启发式规则,实现适应部分互连结构的编译优化。3.提出了负载均衡层次化互连设计。通过分析计算密集型程序的寄存器使用特征,在原有互连结构基础上加入层次化互连。在设计过程中,提出了虚拟化寄存器存储的思想和负载均衡层次化互连的传递式结构。4.进行了针对层次化互连的编译优化。通过一系列启发式规则的层次化互连调度,实现适应负载均衡层次化互连结构的编译优化。实验表明,部分互连结构可以在保证程序性能相当的情况下,有效减小互连结构的面积、延时和能耗,并呈现出良好的扩展性;层次化互连结构可以减缓改善由寄存器分配不均导致的过载现象,并在一定范围内减小程序的调度长度,降低能量消耗。
其他文献
本文针对计算机网络安全这一热点问题,研究了近些年来国际上主要的入侵检测技术,对其中一些解决方案的优缺点进行了分析,主要做了以下一些工作: 本文首先分析了入侵检测技
随着计算机网络技术的发展,以Internet作为载体,以Web作为表现形式的Web CAD/CAM是信息时代CAD/CAM发展的热点,开发基于Web的分布式协同CAD/CAM系统是制造业实现信息化的核心
作业管理的概念非常重要,目的在于强化操作系统的批处理功能,提供对作业的提交、调度、执行及控制等机制,从而能够更加有效地利用系统资源、平衡网络负载,提高系统的整体性能
文中首先对网络处理器的体系结构尤其是IXP2400的内部结构进行剖析,具体介绍了IXP2400上各个重要模块的功能以及它的软件开发模式。而后分析了QoS的结构体系,比较了QoS的两种
本文详细分析了当前国内外相关领域的研究现状和发展方向,阐述了测斜系统的组成、工作原理、数学模型以及系统设计的原则和方法,研究了系统数学模型和软硬件实现方法,完成了
人工智能和机器学习的共同目标是让计算机在没有明确的程序指导下解决问题,因此在过去的几十年里,有关计算机代码的人工演化是一项迅猛发展的技术,各相关领域的人们都期望能有一
软件模式是近年来软件工程领域热门研究的课题,有效地解决了软件设计策略的复用问题,其目标是优秀文档化的软件系统设计成果,为软件设计人员提供类似于其他工程领域的设计手册。
软件行业的工业化趋势导致了构件的产生.能够像硬件系统那样,将部分软件组合起来构建软件系统,一直是软件行业多年来追求的目标.构件技术的出现,极大地满足了多个应用领域的
数字水印(digital watermarking)是数字图像版权保护的关键技术之一,它提供了对数字图像合法保护的方案.数字水印技术能够将信息隐藏于图像中,隐藏的信息能够明确地指出版权
布料动画模拟是当前图形学界的一个热点研究方向。早期的布料模拟通常用几何方法,模拟质量很差。广泛采用物理方法以后,布料动画技术得到了很大的发展。然而这些技术或者计算效