基于动态精度的可扩展高能效CNN加速器设计

来源 :东南大学 | 被引量 : 2次 | 上传用户:yangxue0121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卷积神经网络(Convolutional Neural Network,CNN)是深度学习的重要分支。卷积神经网络在计算机视觉、文本处理、语音识别等领域应用广泛。由于卷积神经网络计算密集,传统的硬件加速方案难以满足嵌入式设备对卷积网络计算的高性能和低功耗需求。针对卷积神经网络中混合结构的组织特征,满足不同计算精度的需求,本文设计了动态识别、精度可控、灵活扩展的高能效卷积神经网络加速器。首先,通过输入数据的复杂度分析,提出了基于动态识别的多层次卷积神经网络压缩策略:卷积神经网络可根据输入数据的信息含量,动态选择需要执行的网络层实现图像识别;对于网络结构层,通过卷积分离和通道分离等方法实现对原始网络的压缩;对于核心算子层,采用Winograd最小滤波算法减少卷积运算的乘法数量;对于操作数层,通过基于卷积核比重的混合量化方案实现网络参数的压缩。针对AlexNet等主流卷积神经网络,该策略使计算量相对原始网络下降29.6%~40.5%。其次,根据卷积神经网络的容错性,使用精度可控的近似计算单元替代精确计算,并采用基于一写多读存储器的查找表实现重复的乘法操作,使乘法计算功耗下降37.5%~45.7%。本文采用多种主流的卷积神经网络作为测试用例。实验结果表明,在TSMC 45nm工艺下,当电压为1.1V和0.9V时,本文所提出的CNN加速器能效分别达到了1.92TOPS/W和3.72TOPS/W。与其他先进方案相比,性能提升了1.51~4.36倍。
其他文献
胃癌的发生是一个多病因,多阶段的过程,涉及到多种癌基因及抑癌基因的异常改变,是多基因变异积累的结果。目前认为幽门螺杆菌(Helicobacter pylori,Hp)和胃癌的发生密切相关,世界
艺术风格和对作品的审美感受这两个概念,在我们过去的文学理论中未加严格界定,造成运用的混乱。实际上,它们栖身于主客体两极之上,存在很大的距离,过两极就是接受主体和文本。“风
本文介绍了 SQDZ1220型琴弦筛的结构原理、筛网动力参数分析及使用经验。
<正>凡遇上级部门来指导检查工作,一般都要听取汇报。可见,汇报材料是最常见的。但真要写好一篇汇报材料,还真不容易。笔者在多年的写作实践中体会到,必须做到"四忌"。一忌讲
期刊
电梯的运行质量,在很大程度上体现了电梯维保质量的好坏和物业设备管理水平的高低。作为电梯的监管部门应该紧紧围绕"预防为主、执法要严"的思想,督促电梯使用和维保单位提升
目的:分析补肾活血汤联合经皮球囊扩张椎体后凸成形术(PKP)对老年骨质疏松性胸腰椎椎体压缩性骨折的治疗效果。方法:选取2015年7月至2017年6月南方医科大学顺德医院附属陈村
在经济增长的极力推动下,人们生活水平相比之前有了焕然一新的改变,从衣食住行的方方面面都体现着居民生活水平的提升,曾经的青砖瓦房到现在的高楼建筑,城市居住格局也在由一
<正>本刊讯2011年11月9日,甘肃省科技厅和青海省科技厅共同组织的"十二五"国家科技支撑计划"祁连山地区生态治理技术研究及示范"项目在北京通过可行性论证。"祁连山地区生态
潜艇周围流场特征会影响潜艇的机动性能,潜艇远场尾流作为探测目标影响其隐身性能,因此对潜艇近远场的流场特征研究有重要意义。目前国际上有标准的SUBOFF潜艇模型,对其建立了详细的试验数据库,因此本文将利用CFD技术对全附体SUBOFF模型的尾流空间演化及流场特征进行数值研究。首先,利用RANS对直航运动状态下的潜艇流场进行计算,将计算结果与试验结果对比,吻合度较高,验证了本文计算方法的准确性。接下来
<正> 潘振武,1908年出生于湖南省常德县(今常德市鼎城区),1926年参加共产主义青年团,1927年在本地组织指挥秋收暴动。1930年参加中国工农红军,同年加入中国共产党。参加了中