【摘 要】
:
近年来,随着计算机性能的显著提升,卷积神经网络(Convolution Neural Networks,CNN)在计算机视觉、语音识别、图像处理等多个领域得到了广泛的应用。其应用场景也从服务器云端开始向嵌入式终端过渡,由于其大量的参数与庞大的计算量,难以应用在嵌入式终端中,所以面向嵌入式终端的硬件加速电路成为研究热点,其中通用微处理器集成CNN加速单元成为一种高效的解决方案。为此,本文提出一种基于
论文部分内容阅读
近年来,随着计算机性能的显著提升,卷积神经网络(Convolution Neural Networks,CNN)在计算机视觉、语音识别、图像处理等多个领域得到了广泛的应用。其应用场景也从服务器云端开始向嵌入式终端过渡,由于其大量的参数与庞大的计算量,难以应用在嵌入式终端中,所以面向嵌入式终端的硬件加速电路成为研究热点,其中通用微处理器集成CNN加速单元成为一种高效的解决方案。为此,本文提出一种基于RISC-V指令集架构的开源处理器结合CNN协处理器的片上系统,为嵌入式终端部署CNN算法提供了支持。本文的主要研究工作有以下几点:(1)研究CNN卷积计算的稀疏性,对模型进行剪枝和量化,并针对特征图和权值参数的特点选择合适的数据存储方法,降低参数在系统中的存储资源占用和传输过程中的时间消耗。(2)设计支持卷积稀疏计算的CNN协处理器,同时利用网络的动态稀疏和静态稀疏特性加速计算过程,通过跳过特征图动态稀疏加速卷积计算,通过屏蔽权值静态稀疏的乘法计算来降低功耗。通过动态任务分发机制和可重构的计算单元阵列设计,解决特征图稀疏的不规则性带来的计算单元负载不均衡问题,提高了计算单元的利用率。(3)基于RISC-V指令集架构的灵活性,设计高效的扩展指令,用于配置协处理器进行协同工作。并将扩展指令添加到编译器中,搭建软硬件协同验证平台,对系统进行分析和验证,得出不同稀疏度的特征图及权值参数对存储压缩率和计算性能的变化趋势,并将压缩后的Lenet-5网络部署到片上系统中与CPU进行对比。实验结果表明,本文实现的片上系统能够压缩参数存储空间,减少数据搬运带来的时间和能耗损失,并对稀疏神经网络有较好的加速效果,整体能耗比约为CPU的20.1倍,为GPU的21.7倍,基本满足在嵌入式应用场景下部署卷积神经网络的需求。
其他文献
研究背景2型糖尿病(Type 2 Diabetes Mellitus,T2DM)是由遗传因素和环境因素导致的糖、脂肪、水和电解质等代谢紊乱的临床综合征。截止到目前,我国糖尿病患者约有1.14亿,糖尿
针对输出级电路增益和输出共模电压灵活可变的需求,提出了一种新型增益与共模电压可编程的输出缓冲级电路。电路由可编程增益放大器(PGA)和采用自适应电流源与新型可编程电阻
徐州市青年路小学调查发现,现在的孩子缺乏感恩情怀,甚至不知道怎样回报亲恩,家庭教育中"德智"天平的倾斜导致了感恩教育被忽视。实施感恩教育应重在通过一系列活动,教会学生
近年来,机器视觉的发展突飞猛进,它在智能化信息领域占据举足轻重的地位。它涉及的范围也是极其广泛的,包括图像处理、光学电子技术、计算机技术,此外近期十分火热的模式识别
成组技术是上世纪50~60年代产生的,应用于纺织机械、飞机、机床及工程机械等行业的一门生产技术科学。随着计算机技术和信息技术的发展,应用成组技术、信息技术与修造船生产条
以信息披露为核心的IPO注册制是资本市场重要改革,而会计师事务所在其中的作用是重要但尚未深入研究的话题。基于证监会对事务所行政监管的数据以及科创板的独特场景,本文研
随着人工智能应用技术的快速发展,中央处理器和存储电路之间大量的数据传输被公认为目前传统的冯诺依曼计算机体系架构中最大的瓶颈。深度神经网络作为目前在人工智能领域中
随着时代的进步,科学技术的不断发展,测量工程与测量仪器工具也在不断的更新和改进,促使施工放样工作越来越简化,精度也越来越高。人们可以根据需要采用不同的放样方式。对一
随着摩尔定律逐渐接近尾声,一味地通过提升工艺来比拼硬件性能将变得越来越艰难。在现有工艺下,如何改进硬件架构来适应不断变化的人工智能算法变得愈发的重要。为了针对具体
在目前阶段,在金融部门与因特网高技术密切联系的情况下,通过P2P网络提供贷款是金融创新的一个重要步骤,在完善市场资金结构、优化利率市场体系、建立健全普惠金融制度等均发挥着不可小觑的积极意义。但是,由于对我们的互联网金融系统的不规则管制,加之P2P网贷平台信息受限、运营不够科学化、资金监管不到位、风险规避制度不完善等,造成目前金融业风险仍不能有效降低的突出问题。本文从J公司P2P理财平台着手,基于J