基于RISC-V处理器的卷积加速SoC系统设计

来源 :山东工商学院 | 被引量 : 0次 | 上传用户:qqboygogogogo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着物联网技术在城市、农业、工业和医疗等领域的广泛应用,物联网终端设备被大量生产并使用,然而传统终端设备所采集的数据,尤其是视频图像等在未经处理的情况下被直接传到云端,导致服务器无法处理剧增的数据,同时未经处理的数据存在严重的安全隐患,而长距离的数据传输也会导致数据延时。因此,如何提高终端设备的数据处理能力,在终端完成图像数据的特征提取或目标识别成为目前物联网领域急需解决的主要问题之一。本文从多任务处理以及数据运算角度出发,再结合终端设备对低功耗、低资源消耗以及高性能的需求,分为以下五个方面进行研究。(1)采用FPGA原型验证方式得到Ibex、CV32E40P以及CVA6处理器相关参数,从资源消耗、功耗以及性能进行判断,发现CV32E40P具有高性能、低功耗、资源消耗少的优点,满足物端设备实际需求;(2)将CV32E40P处理器嵌入进PULP项目中的CL多核架构,并编写测试程序对搭建的多核架构进行FPGA原型验证以及功能性仿真。结果表明,多核架构实现了单任务并行处理以及多任务并行处理的目标;(3)将部分Crossbar总线架构替换AXI总线中的全Crossbar总线架构,在不影响数据传输速率的前提下节约了17.86%的资源消耗;(4)针对卷积加速器计算单元中的乘法器进行结构优化,保证低资源消耗的同时,提升乘法器的计算效率,相比于传统移位相加乘法器,虽然资源消耗提高了9%,但是性能提高了39.375%;(5)根据模块化、并行化以及流水线设计思想,基于卷积层计算过程设计六级流水线的卷积加速器,避免数据传输过程中的阻塞问题,卷积加速器的计算速度达到了0.398GMAC/s,发挥了乘法器性能的49.8%,相比于同类设计取得了良好的性能表现。综上,本文通过研究RISC-V官方提供的PULP平台实现项目,提出了一种应用于物联网终端设备,具有卷积加速功能的物端SOC系统设计方案。CV32E40P处理器满足物端对低功耗、低资源消耗以及高性能处理器的需求,多核架构提高系统多任务处理能力,部分Crossbar总线架构避免总线上不必要的资源消耗,结构优化的乘法器为卷积加速器提供高效计算能力,流水线的模块设计充分发挥计算单元性能。
其他文献
“审美”是音乐教育的核心本质,我国高中音乐学科无论是从课程理念还是音乐教材都一贯体现着“审美”的核心理念。本文以2004年我国教育部出台的《普通高中音乐课程标准(实验)》和2017年《普通音乐课程标准(2017年版)》为指导目标,对课程标准提出的“审美”理念,以人民音乐出版社和湖南文艺出版社出版的高中《音乐鉴赏》教材为例,进行初浅的研究和比较分析。本论文采用了文献分析法、比较研究法、调查研究法和实
多目标跟踪因为其重要的学术价值和非凡的商业潜力,在计算机视觉领域备受关注,例如在自动驾驶、航空航天、医疗诊断、智能监控等众多领域得到了广泛的应用。在最近的十几年中,研究人员已经提出了大量的创新算法来研究这个课题,多目标跟踪的技术取得了很大的发展,但在面临诸如目标重叠、外观剧变、光照变换、身份跳变等问题时,仍然存在着重大挑战。本文旨在从多目标跟踪中的数据关联出发,利用行人重识别技术,分别与多假设跟踪
当标注数据充足的情况下,现有的文本分类方法已经可以取得比较好的效果。近来基于深度学习的文本分类方法的发展,已经使得文本分类任务的性能达到了工业界的应用要求,特别是基于预训练+微调的两阶段文本分类方法,更是将文本分类的效果推上了一个前所未有的高度。但文本分类效果提升的同时,模型的复杂度也在迅速的增加,对标注数据集的规模以及质量的要求也在不断提高,使得应用场景很是受限。在实际应用中文本分类任务的训练数
深度学习方法在图像分类任务中取得了巨大成功,然而深度神经网络模型的优异表现高度依赖海量的标签样本数据。当样本数量较少时,模型训练受到限制,易发生过拟合现象且泛化性能差。在实际应用中,海量标签样本的获取往往十分困难。因此,如何高效利用深度学习模型解决小样本图像分类问题具有重要意义。深度度量方法旨在学习一高效度量空间,有效完成输入特征的非线性映射,准确反映样本间相似程度。针对极端的小样本图像分类任务,
本文文言文同义动词的选择范围为2007年3月第2版人民教育出版社出版的《普通高中课程标准语文实验教科书(必修)》。文章从课程标准、教科书课后习题以及一线教师访谈出发分析当前的文言文同义动词教学现状与问题。从教材中挑选出16组常见同义动词,在学习和吸收之前学者的经验成果上,分析词组内部成员之间的异同,再结合教学需要探讨高中文言文同义动词教学策略,也期待为今后的语文教学提供可靠性意见。本文除绪论和结语
关键蛋白质是细胞生活重要物质基础,其缺失会使生物体致病甚至死亡。准确高效识别关键蛋白质可用于了解细胞功能,并且对药物设计提供极其重要的指导与思路。近年来,高通技术飞速发展,大量蛋白质相互作用(Protein-Protein Interaction,PPI)数据被挖掘出来,许多基于PPI网络的关键蛋白质识别方法被提出,这些方法大致分为两类:一类是基于网络拓扑特征,另一类是融合亚细胞定位等其他蛋白质生
抠图(Matting)是指将静态图像或者视频图片序列中的前景对象精确提取出来的过程。如今抠图技术已是计算机视觉领域中的关键技术之一,更是图像合成技术的基础,已广泛应用在了虚拟演播厅、影视剧的制作、图像编辑等多个领域中。而在实际应用中,由于图像复杂多变导致抠图实施起来十分困难,为了降低抠图的复杂度,在处理抠图问题时通常需要用户提供一个先验信息。该先验信息一般以三分图(Trimap)的形式来呈现,尽管
相机在低光照下无法获得足够的光源,使得拍摄的图像出现欠曝光现象而严重影响图像的观看效果。低光照图像较低的亮度和对比度是后续计算机视觉任务的巨大的阻碍。在低光照增强时,需要同时兼顾亮度、对比度、伪影和噪声等多个因素,使得该问题具有挑战性。虽然人们已经对低光照问题展开了广泛的研究,但增强结果中仍存在暗区域、伪影以及细节丢失等问题。综合考虑现有方法存在的优缺点,本文对低光照增强方法进行创新,并提出了自己
心智模型(Mental Model)概念最早由苏格兰心理学家肯尼斯·克雷克(Kenneth Craik)在1943年提出。本研究将心智模型界定为在认知学习或者为了回答、解决问题时,个体根据自身的经验和所学知识产生的一种动态结构与内部表征。在化学教学中,研究学生的心智模型有助于教师提高教学效果和质量。将迁移教学与心智模型结合有助于完善心智模型研究体系。对于心智模型的研究,化学教学研究者主要从事的是调
近年来,脑成像模态迁移技术在医学成像领域变得流行,在脑疾病的临床诊断和病情检测中起着非常重要的作用。例如脑图像重建、脑图像降噪、脑图像分割。脑成像模态迁移技术旨在学习不同模态脑图像之间的映射关系,实现一种模态脑图像到另一种模态脑图像的转换,从而解决某些成像技术不可用或者某种模态数据不完整的情况。而多种模态数据的获得,也为临床诊断医生提供多样性的信息。常用的脑成像模态迁移方法分为基于监督学习的方法和