动态可重构系统下的卷积神经网络并行计算研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:duchze
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展,卷积神经网络及其应用逐渐成为研究的热门方向。目前用于实现卷积神经网络的硬件主要包括CPU、GPU、FPGA以及NPU(Network Process Unit)等等,但由于卷积神经网络属于计算密集型应用,CPU处理速度较慢,GPU体积大且功耗高,难以用于嵌入式场景中。FPGA等可重构系统既具有高速处理数据的能力又具有编程的灵活性,十分适合用于加速神经网络的计算,利用有限的可重构硬件资源加速卷积神经网络计算是目前研究的热门方向。尽管可重构系统的硬件资源有限,但是动态可重构技术实现了在系统运行过程中对硬件资源进行重新配置,通过分时复用手段解决了资源有限引起的计算效率低的问题。动态可重构方式需要依靠合理分配硬件资源和任务调度算法才能达到较高的计算效率,因此本文针对可重构系统中卷积神经网络的并行计算进行研究,主要贡献如下:(1)设计了多个卷积神经网络在CPU结合可重构资源架构下的并行计算框架。通过对卷积神经网络进行任务划分,并对每个任务定量分析得到DAG图,结合任务调度算法将DAG图中的任务分配到划分好的局部硬件资源上计算,利用动态可重构方式达到了多卷积神经网络任务的并行计算,使得整体计算效率提高。(2)结合以上的并行计算框架设计,本文设计了一种针对任务规模较小场景下的DAG任务调度算法。该算法通过建立一个优化目标为所有任务完成时间最短的整数规划模型对调度问题进行描述,并采用分支定界法对进行求解,得到最优的调度方案。(3)本文设计了一种结合任务分层与层内调度的分阶段调度算法,适用于任务规模大的应用场景。该算法根据DAG图的拓扑顺序对任务进行分层,确保每层内的任务之间没有依赖关系。通过对每层内的任务建立整数规划模型进行调度,最后将所有层的调度结果进行合并得到最终的调度方案。综上,本文设计的卷积神经网络并行计算框架,基于CPU结合可重构资源架构实现了对不同任务规模场景下的任务调度和计算,通过充分利用硬件资源达到了提高整体计算效率的目的。
其他文献
随着新型城镇化的不断推进,我国地方政府债务加速积累,同时地区经济增长速度放缓。本文利用全国30个省市自治区的相关数据,运用系统广义矩估计方法从全国层面和地区层面对地
<正>中国传统饮食,不仅讲究色鲜味美,且注重营养价值和保健功能;亦强调其文化内涵,使之形成一种独特的民族文化。云南鹤庆传统的"八大碗"宴,也可算是别具一格的文化载体。"八
研究生助教是对研究生自身能力的培养和锻炼,同时也补充了本科教学教师资源。提高本科教学的质量,需要加强对研究生助教的培训、指导、管理和考评,也需要加强课程教学的统一
长期处于垄断体制下和不完全竞争状态的中国烟草商业企业市场相对封闭,但随着烟草行业改革和市场经济的不断发展,既面临着烟草专卖体制改革和诸如供给侧改革的压力,又面临着
<正>盐城位于江苏北部,盐城人也就是所谓的"苏北人"的一部分。三十年前盐城经济落后,盐城人买肉喜欢买肥肉,在今天来说有点匪夷所思了,但那时不一样,因为肥肉多了吃起来才有
会议
PLC控制技术实训这门课是高等职业技术学校自动化专业的一门核心课程,其教学案例可以与实际生活相关联,从而可以提高学生的学习兴趣。本文介绍了利用松下FP∑系列PLC对十字路
衣食住行关系国计民生。《道路交通安全法》将道路交通安全管理的权力赋予了公安机关交通管理部门,作为道路交通安全管理主体的公安机关交通管理部门依法享有相关法律法规赋
手表定律手表定律是指一个人有一只表时,可以知道现在是几点钟,而当他同时拥有两只表时却无法确定。手表定律给我们一种非常直观的启发——对同一个人或同一个组织不能同时采
期刊
该文以欧阳竟无、吕澂、韩清净、太虚四位近代唯识学代表人物的唯识思想为主要研究对象,从类型上把他们的唯识研究分为哲学、历史学、语义学、宗教四种“进路”,通过对四人唯
目的:本研究综合数所中医药院校的中医学专业培养方案,结合我国现行的中医学本科专业教育标准,构建中医学本科专业(以下简称“中医学专业”)培养目标达成度评价体系,并根据调查研究和试评研究结果提出中医学人才培养工作的改进对策与建议。研究成果供兄弟院校参考。方法:本研究主要采用文献研究法、访谈法、问卷调查法、德尔斐法、层次分析法、数理统计法等。首先,采用文献研究法和问卷调查法,初步构建了中医学专业培养目标