高性能浮点运算单元设计研究

被引量 : 0次 | 上传用户:jialin131466
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着嵌入式系统中图形处理、3D游戏等基于浮点的运算密集应用日益增多,高性能低功耗的浮点运算单元将成为未来嵌入式处理器关键部件。本文围绕浮点运算单元的架构设计,重点研究提升浮点运算能力、减少硬件开销、降低动态功耗等关键技术,主要研究内容和创新点包括:1、浮点SIMD指令集扩展及其高效资源复用硬件框架。首先设计了面向并行处理应用的的浮点SIMD指令集,并提出了一种采用资源复用的SIMD运算单元设计方法。该方法通过将执行双精度指令的数据通路分割为相互独立的两路,仅通过增加少量控制逻辑,实现单精度SIMD运算对双精度指令数据通路的高路和低路的高效复用,以极小的硬件代价获取浮点运算性能的大幅提升。2、统一的浮点除法与开方SRT算法。提出影响SRT算法性能和开销的主要参数的选择方案。基于边界值公式变换和操作数预处理的方法,实现了除法和开方SRT选择函数的统一。提出一种基于常量比较和译码的选择函数设计方法,解决传统设计资源占用大、电路延时长的问题。基于在线转换的商和平方根的累加方法,将累加过程转变为简单的移位操作和逻辑或操作。基于预测的运算加速机制,利用浮点运算特征预测计算结果,根据预测结果对SRT算法迭代次数进行控制以实现运算加速。3、针对浮点加法和除法/开方运算的快速舍入方法。在浮点加法结果舍入逻辑中将尾数取补码过程和舍入加法过程合并,仅用一个加法器就实现了取补码和舍入的过程,解决舍入延时长的问题。基于在线转换的SRT除法与开方舍入机制,利用SRT算法迭代的计算过程直接得到舍入加1和减1的值供舍入判断逻辑选择,解决了关键路径问题。4、基于浮点运算特征的细粒度门控时钟优化技术。基于不同运算精度的门控时钟技术,在浮点单精度运算时彻底关闭空闲的低位数据以降低功耗。基于异常预测的门控时钟技术,通过预测当前指令发生异常的情况,在预测到异常发生时关闭整个数据通路的时钟,消除冗余动态功耗。基于运算结果预测的门控时钟技术,操作数为零或者无穷时根据指令类型预测运算结果,并关闭相应的数据通路的时钟以减少动态功耗。
其他文献
课后作业是检测课堂教学效果的重要方式,可以有效帮助学生巩固课堂知识。对于小学阶段六年级的语文课程而言,课后作业的有效设计,能最大限度地减轻小学生学业负担,丰富课余生
2008年,由于金融危机的影响,我国新车销量出现了10年以来的第一次缓增长,全年总销量为938.05万辆,同比增长6.70%,相比前几年20%的增长大幅下滑。但是二手车车的交易量却增长1
随着零售业的蓬勃发展,大型超市成为我国居民购买日用生活品的首选购物场所。然而,中国目前内资的大型超市还没有能和家乐福、沃尔玛等国际零售巨头竞争的实力。虽然百联集团
随着资源的日益枯竭和环境保护意识的加强,风力发电作为最具竞争力、最有发展前景的一项可再生能源技术,在全球范围内得到了高度重视。双转子永磁风力发电机具有与传统电机不
目的探究持续质量改进在电子支气管镜检查护理中的应用效果。方法选取2016年1月~2018年1月在我院进行电子支气管镜检查护理的患者130例,将之随即均分为研究组和对照组,两组各
我国乡镇政府的职能转变问题,一直是党和政府关注的重大问题,也是我国学术界热点研究问题。政府职能是政府的核心,是政府角色定位的集中体现。随着社会经济的发展,广大公民和
债务重组准则,于1998年颁布,由于实务中上市公司利用债务重组操纵利润,该准则于2001年被修订,以遏制利润操纵,前人的研究表明,这一监管导向的修订并未损害会计信息的有用性。
本文报道了天门冬、密齿天门冬、短梗天门冬、羊齿天门冬的药材性状和显微特征,并进行比较鉴别。
1 猪高热病1.1 症状猪群突然发病,体温升高到40%以上,精神沉郁,食欲降低或废绝。病猪皮肤发红,耳后耳缘发绀,腹下和四肢末梢等多处皮肤有斑点,呈紫红色,病猪呼吸困难,喜俯卧。有的流鼻
黄宾虹从少年时即开始学习篆刻,至三十岁左右进行古印的收藏,此后无论其寓居上海还是困居北京,都从未间断对古印的收藏。将收藏的古印著录成印谱,以便进行印学研究和传播,所