高性能通用处理器中浮点乘加部件的设计

来源 :中国科学院计算技术研究所 | 被引量 : 10次 | 上传用户:tfgzs888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着集成电路集成密度的持续提高和成本的不断降低,单一芯片内能够集成更多的器件,采用更复杂的结构,完成更强大的功能。浮点运算能力是考察一款通用处理器性能的重要指标之一。浮点乘加部件作为一种功能强大且用途广泛的运算部件,可以显著提高处理器的浮点运算能力。这一点已被多款商用的通用处理器所证明。因此,高性能通用处理器有必要增加浮点乘加部件。浮点乘加部件的优点包括:速度快,精度高,能够降低对总线带宽的需求,减少读写寄存器堆的压力,提高指令吞吐率等。此外,浮点乘加部件能够执行单独的乘法和加法指令,还能够在软件控制下进行除法、开根运算,实现基本函数功能。传统的浮点乘加部件采用“乘法-加法-规格化-舍入”的结构。与此不同,本文采用更为先进的浮点乘加部件结构,即“乘法-规格化-加法并舍入”,有效降低了延时,性能更为突出。缺点是付出了较大的面积代价。前导1预测(LOP)是浮点乘加部件设计的关键算法之一。浮点乘加部件需要实现3个操作数的前导1预测电路,传统的LOP算法不能直接处理3个操作数,通过间接方法实现又会增加关键路径延时并增大电路面积。针对这一局限,本文提出了三个操作数的前导1预测算法,进行了理论推导和实验比较,可以有效缩短前导1预测电路的延时并减少面积,从而缩短整个乘加部件的延时。通过浮点乘加部件执行乘加、乘法、加法的延时都是一样的,这可能会造成某些应用下乘加部件的性能反而不如乘法器和加法器的情况。乘法/加法旁路技术可以改变这种情况,将浮点乘加部件执行乘法/加法的时间有效降低,从而提高浮点乘加部件的总体浮点性能。
其他文献
目前的科研和商用人脸识别系统能够在小规模人脸数据库、用户配合、摄像环境接近理想的情况下获得令人满意和满足一定实际生产要求的结果,但在更大规模人脸数据库、用户不配
本文基于对目前宽带接入网网管实现技术的研究,提出了采用TMN(电信管理网)体系结构和SNMP为接口的统一网管分层体系结构。整个结构从下到上依次为数据交换层、数据分析处理层
Petri网适合于网络环境下的信息处理系统的描述和建模。它的主要特性包括:并行、不确定性、异步及分步描述能力和分析能力。Petri网以其简洁、直观、潜在模拟能力强等特点被
TCP协议是固定网络上有效的端到端传输协议,它在应用于复杂多变的无线网络时性能却大大下降。这主要是由于TCP的错误控制机制不适用于无线网络。针对固定网络设计的标准TCP协
Robocup机器人足球系统是一个典型的多智能体系统,同时也是一个典型的多智能体协作与竞争系统,它为分布式人工智能的研究提供了一个标准的试验平台。多智能体学习与协作是当
随着Internet的迅猛发展,越来越多的应用基于网络展开,而作为网络上数据表示和交换的事实标准,XML也被这些应用大量使用。XML作为信息的载体在网络上的广泛应用带来了XML的安全
随着互联网的迅猛发展,网络的安全性问题愈来愈重要。目前解决网络安全问题的主要技术手段有口令认证、加密技术、安全审计和防火墙技术等,它们在防御网络入侵方面有一定的作
分类在数椐挖掘中是一项非常重要的任务,本文研究的是基于决策树的分类技术。与其他分类技术相比,决策树技术具有许多优点:决策树更易被用户理解;生成决策树的效率更高、更适
车载卫星定位系统,又称自动车辆定位系统,对它的研究起始于二十世纪七十年代。最初的应用是为了解决汽车文明带来的日益严重的城市交通问题。时至今日,车载卫星定位系统集合
随着Internet在社会各个领域的不断推广,以及“网络黑客”事件的时有发生,使得“网络安全”正日益受到业界的关注和重视。造成Internet网络不安全局面的原因很多,网络攻击和非法