深度卷积神经网络嵌入式推理框架的设计与实现

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:bimzhouhong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从2012年开始,深度卷积神经网络极大促进了计算机视觉算法的发展,而为了达到更好的性能,研究人员设计的卷积神经网络模型越来越大,从Alex Net到VGG、Google Net、Res Net等。由于隐私或者网络等原因,不能将嵌入式或移动平台上的数据发送到端服务器,因此在嵌入式平台上部署运行卷积神经网络模型成为一种新的发展趋势。而这些参数量、计算量很大的卷积神经网络不适用于计算资源比较有限的嵌入式平台。所以出现了一些专门为嵌入式移动平台设计的轻量化卷积神经网络如Mobile Net、Shuffle Net、Squeeze Net等。然而这些轻量化卷积神经网络是在桌面平台上训练的,如果直接将这些轻量化卷积神经网络运行在嵌入式平台上,其性能不高。所以本文设计实现了一个深度卷积神经网络的嵌入式推理部署框架来解决这个问题。本文设计实现了一个适用于ARM CPU嵌入式平台的深度卷积神经网络嵌入式推理框架,整个框架主要包含四个组件:模型转换组件Convertor、运行时Runtime、网络基础组件(Net、Layer、Blob等)、加速组件Accelerator。本文通过理论和实验,分析出轻量化卷积神经网络在嵌入式平台上的推理过程中的性能瓶颈,并且针对1×1标准卷积和3×3深度可分离卷积设计了相应的优化算法,提升这些网络层的推理性能。还设计了一个内存池算法来解决卷积神经网络轻量推理模式(推理过程中释放掉以后不会用到的特征图内存)引入的频繁内存分配和释放问题,提升了整个框架的性能。最后在Firefly-RK3399开发板上通过实验测试了本文所设计实现的卷积神经网络推理框架。实验结果表明,我们的1×1卷积优化算法相比于未优化前有着大约70%—90%的性能提升,3×3深度可分离卷积优化算法在计算量大且CPU算力弱的情况下也有50%左右的性能提升。而我们的内存池算法在轻量推理模式的配合下可以在不损失推理性能的前提下降低推理过程中的内存占用。
其他文献
针对高校新教师教学能力培养的现状及存在的问题,从高校管理工作者要全面评价教师的学术水平,健全新教师培养的制度,继承和发扬传统的导师制等方面提出了提高新教师教学能力的有
在仿真训练愈来愈受到各国重视的今天,如何贴近实战,结合实际装备,打赢信息化条件下的局部战争,成为部队仿真训练的新的课题;提出了一种新的网关连接方法,即以高层体系结构(HL
车辆工程学科于1998年被评为中国兵器工业总公司重点学科,1999年被评为重庆市重点学科,2002年被评为重庆市“十五”期间重点建设的重点学科。2006年评为重庆市“十一五”重点学
设计实现了一款BD/GPS双模通用卫星导航模块,可用于包括无人飞行器自主飞行控制与导航在内的多个领域。该模块由包括导航核心模块及外围EEPROM、备用电池、天线接口、输出接口等多个部分组成。通过设计软件测试方案,进行实际测试,证明该模块具有单模/双模组合工作能力、定位速度快,定位精度高、接口丰富等优点,各项性能均达到了指标要求。
为了研究装甲目标毁伤概率计算方法,把装甲目标各部位按功能进行了区域划分和毁伤概率分析,以各区域的毁伤概率和命中概率为自变量给出了整体毁伤概率的计算公式。在各区域正
以2006年世界男排联赛成都赛区中国男排和与赛队的比赛为研究对象,对现代男子排球发球技术运用进行对比研究,结果表明:中国男排运动员在发球得分、发球效果与世界强队的差距较大
研究了中空纤维膜液相微萃取提取尿液中痕量苯丙胺类毒品的最佳萃取条件。本实验从甲苯、邻二甲苯、环己酮、乙酸乙酯、乙酸辛酯、正壬醇和正辛醇7种有机溶剂中筛选最佳萃取
<世说新语>中的复音副词,从意义类型看,有表时间、语气、范围、情态等,种类齐全.这些副词复音化的表现形式主要有四:(1)原有的单音副词附缀"自"、"复"、"当";(2)原有的单音副
六朝时期文学家族数量之多,为其他时代所罕见。对这一现象产生的原因进行较为深入的探讨,可以深化对文学创作与时代特征关系的认识。统治者的大力提倡和躬亲创作,社会环境的催生
2008年10月12日,中国干燥技术产业发展论坛在江苏常州江南春国宾馆胜利召开。出席会议的有中国化工学会化学工程专业委员会秘书长屈一新教授,常州市武进区委常委、常务副区长张