基于异步方法的卷积神经网络计算系统的设计与分析

来源 :兰州大学 | 被引量 : 1次 | 上传用户:liuhu8207
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卷积神经网络是当前众所周知的一种经典神经网络模型,卷积计算是卷积神经网络中最重要的计算形式之一,如何降低卷积计算中的功耗和提高卷积计算速度是卷积神经网络研究中的重要问题,现有的CPU已经很难满足卷积计算的速度、以及功耗需求,因此本文提出了一种基于异步方法的卷积神经网络加速系统以解决卷积计算的问题。首先,本论文对卷积神经网络的算法进行充分的调研,选用Caffe框架来实现卷积神经网络算法。但是该模型在进行识别操作中,大量的时间用于卷积计算中。为了能够更加有效的加速Caffe框架中的卷积算法,本文提出了一种基于FPGA的卷积神经网络计算加速系统,此系统的软件部分是基于Caffe框架的Mtcnn模型,硬件系统部分是基于异步的卷积计算加速器,二者通过DMA管理的DDR进行数据交互。ZYNQ是Xilinx开发的一款FPGA开发板,其由FPGA可编程逻辑部分的PL端和以Arm为核心的PS端组成。在本方法中,卷积神经网络的卷积算法在PL侧FPGA上实现,数据通过DMA与PS端的Linux操作系统进行交换。FPGA完成卷积计算后,计算结果通过DMA返回Linux。卷积计算具体结构使用Verilog语言进行描述,并由Vivado综合实现,可将百万周期的计算可以优化到万级周期。其次,本论文详细介绍了在FPGA上的卷积计算模块和片上存储机制,主要包括了权重矩阵和图片矩阵的读写模式以及矩阵乘法的计算方法,经过充分的调研和分析,发现采用异步握手信号来代替同步时钟信号,在实现时更易于模块化且方便管理,而且能有效的避免了时钟歪斜,速度慢等问题。在功耗方面本论文的设计也有很大的优势,同样通过仿真测试,Xilinx提供的浮点数加法器IP核的功耗是21.843w,而本设计的功耗为7.006w,这种功耗优势会随着浮点数加法器的使用频率的提高而越来越明显。最后,经过实际实现后的测试数据结果显示,本论文设计相比基于ZYNQ7020原有的CPU来实现人脸识别加速了一倍左右。
其他文献
青年教师的健康成长关系着职业院校的发展与未来,关系着技能型人才培养的质量。文中从理论与实践两个方面出发,深入探索了职业院校青年教师成长的要素和影响成长的主要因素,
截至2010年8月,日本三大碳纤维生产商东丽公司、Toho Tenax公司和三菱人造丝拥有全球聚丙烯腈基碳纤维70%以上的市场份额。随着韩国和印度公司涉足该领域,这种垄断的局面将被
随着泰国曼谷中心经济的不断发展,大部分的泰国人选择移民到曼谷。由于泰国曼谷的房地产行业不断发展,曼谷的面积越来越小,同时住宅需求越来越大影响了房价的不断增涨,同时也
目的分析新疆维吾尔自治区专业公共卫生系统机构及人员近十年变动数据,掌握新疆维吾尔自治区专业公共卫生系统配置状况及发展趋势。方法收集2005-2014年新疆维吾尔自治区专业
皖水是长江支流之一,由皖水、潜水、长河三大支流组成,位于安徽省岳西县境黄梅尖南麓,其水文地质条件是影响河道价值的重要因素。本文结合实际工作对安庆市潜山县皖水水文地
2月14日晚,北京街头人来人往,大小食肆灯火通明、人声鼎沸。周末,又是西方传统的情人节,即使是远在东方,也能感觉到空气中浓烈的情爱气息。花店的玫瑰已经卖到了每枝30元,而
由于信息不对称和委托代理目标的不一致,在建筑工程领域常常会引发代理人的逆向选择和道德风险,当多个代理人能够相互合作与沟通时,容易导致合谋行为,共同侵占委托人利益。通过对
卫星城市、中心镇是大城市体系中依附于大城市、与大城市联系紧密、处于大城市周边而又与大城市相对独立的中小城镇。卫星城市、中心镇的设立对缓解大城市的人口、就业、住房
黄嘌呤氧化还原酶抑制剂能有效抑制尿酸生成,对于治疗高尿酸血症具有显著的效果。黄嘌呤氧化还原酶抑制剂的药物代谢研究不仅能够解释其在体内的转化,也能够被用来预测药物的
树形聚酰胺-胺(Poly(amidoamine)dendrimer)因其结构独特、粘度低、含大量官能团、内部存在大量空腔等性质,近年受到广泛关注,但其复杂的合成工艺使其应用受到很大限制,而超支化