基于FPGA的深度信念网络加速系统研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:double3A
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,随着深度学习概念的提出,以及计算能力的不断提高,深度学习展示出了很高的科研价值和实用价值,受到了学术界和工业界的青睐。深度学习的概念源于人工神经网络,是机器学习中富有生命力的一个研究领域,其动机在于建立、模拟人脑的神经网络,来解释图像、声音和文本等数据。深度信念网络是深度学习中一种基础的深度神经网络类型,也是一种典型的深度生成式模型,由多层受限玻尔兹曼机堆叠而成。目前深度信念网络普遍应用于语音识别、手写识别、文本分类等应用领域。深度信念网络属于全连接神经网络,因此当网络规模不断增加时,其参数量和计算量均急剧增加。如何更快速有效地处理海量数据,是深度信念网络的主要研究方向之一。目前通过多核处理器集群、云计算平台或通用图像处理器对其加速都有比较成熟的研究,但仍存在计算效率低或能耗开销高等问题。采用现场可编程门阵列FPGA等可编程硬件加速深度学习算法是常用的加速手段之一。基于FPGA的深度学习加速器具有高性能、低功耗、可重构等特点。本文从深度信念网络的预测过程出发,研究在FPGA加速平台上对全连接结构的神经网络的高性能实现,并设计相应的加速系统,主要工作有:1.分析深度信念网络的预测算法,挖掘单层网络内和多层网络间的计算并行性,并根据FPGA的计算资源和存储资源情况,设计算法的基本计算单元,实现单FPGA加速系统。为达到高吞吐率的要求,计算单元主要采用流水线设计。2.将加速器设计扩展到多FPGA加速系统中,将深度信念网络按层横向划分,或层内按块划分,使其计算分布于多片FPGA上,采用流水线或并行计算进一步提升性能。3.根据实现的多FPGA加速系统,提取影响加速系统的关键因素,建立性能模型,分析不同划分方案下的加速系统适用的网络结构和应用场景。为了验证设计的硬件加速系统的性能和性能模型的正确性,本文通过实验,将加速系统的性能与CPU、GPGPU和传统的单FPGA加速系统进行对比。经实验验证,本文实现的加速系统具备良好的加速效果,且运行时功耗和能耗低,具有较高的能效性。
其他文献
小学信息技术课程教学方法还有待进一步地探索,是一个长期的课题,只有不断总结,才能找出更佳、更适合的教学方法,才能激活学生的创新思维,调动他们的内部驱动力,完善教学体系,才能探
人有七情六欲,这原本是正常的现象,教师也是人,自然也会有喜怒哀乐,心理学家们说:情绪是一种复杂是心理现象,它包含情绪体验、情绪行为、情绪唤醒和对刺激物的认知等。教师有情绪、
时下,信息技术的迅猛发展,使社会发生了巨大的变革,也必然促使信息技术课堂教学产生深刻的变革。网络正以迅猛的速度介入到中学生的日常生活中,它无论对中学生当前的学习及今后的
鸡群的接种方法应根据疫苗的类型、疫苗的特点及免疫程序选择确定,常用的有点眼、滴鼻、饮水、注射、刺种、气雾等六种方法。具体采用什么方法,应根据疫苗的类型、疫苗的特点及
富有理性精神的人善于通过对历史和现实的考察,追问问题的成因,能做出明智的判断和合乎逻辑的推理,既有批判能力,也能智慧地处理人生问题和社会问题。在汉语里,"理"的原初意义
实验是生物学教学的重要组成部分,是提高生物教学质量的重要环节。而当前生物教学还有一些薄弱环节,比如说教师对实验教学质量不够重视,课前准备与精心设计不够,忽视操作技能的改
传统初中英语阅读教学在教学内容、教学手段和教学策略等方面存在着许多不足之处,因此,初中英语阅读教学的改革与创新势在必行。教师要改变传统初中英语教学中过多侧重语言知识
系列盗窃案件对社会危害性大,影响恶劣,是"飓风行动"打击的重点。在传统案件侦查工作中往往通过手段、基站信息等分析串并方法,看似关联却不能形成强有力的证据链条,难以适应
为筛选出适合在福建省厦门市及周边地区种植的太空豇豆品种,首次引进2个航天豇豆品种,以当地适宜品种比优20为对照,进行品比试验。结果表明,航豇1号产量最高,商品性、抗病性表现较
由于传统的初中历史课课堂教学方法影响了学生学习的兴趣,通过实施统一教师的教学内容和进度,规范教师的教学行为和手段,使得学生在学习的过程中缺乏合作式教学理念交流,合作式教