适用于边缘计算的RISC-Ⅴ向量协处理器设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:totti_sqh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着物联网技术、边缘计算和人工智能的高速发展,网络边缘的嵌入式处理器需要承担越来越多的计算密集型应用,如图像处理、加解密算法、CNN数据推断,而常规的处理器在此类应用场景下性能表现往往不佳,因此需要借助通过硬件实现算法加速。使用专用加速芯片、FPGA或在SoC上挂载硬件加速器能够有效提升处理效率,但也存在着应用场景单一、硬件定制成本高的问题。因此,通过在嵌入式处理器上添加单指令多数据的向量架构,能够在硬件架构不变的前提下实现实现对多种边缘计算应用的硬件加速,这对于降低嵌入式处理器的应用成本、提升嵌入式处理器面对计算密集型应用的处理性能具有重要价值和意义。基于RISC-Ⅴ向量指令集扩展,本文提出了一种支持动态调度的向量协处理器架构,将指令级并行和数据级并行的设计思想相结合,为边缘计算场景下的嵌入式处理器提供硬件加速。本设计的动态调度机制中,发射队列将满足条件的指令乱序发射并执行,降低RAW数据冒险阻塞流水线导致的性能损失;寄存器重命名机制消除了WAW和WAR数据冒险;重排序队列通过让路乱序执行的指令顺序提交,确保程序结果的正确性。实现了配置、向量访存、向量整数型和向量浮点型运算四类指令功能。配置指令通过修改控制状态寄存器,可以对向量的元素位宽、长度和编组情况进行配置,以适应不同的算法应用。访存单元实现了连续寻址、步幅寻址和索引寻址三种访存方式,对地址128位对齐的连续寻址情况进行优化,并在发生LAS数据冒险时提供数据旁路以加快访存速度。整数型执行单元实现了加减、比较、选择、逻辑操作、移位、定点和归约几类指令功能,并通过复用计算电路的方式缩小电路面积。浮点型执行单元实现了加法、乘法、乘加和选择的指令功能,并使用Chisel中的寄存器重定时注解优化融合乘加单元的关键路径。本文在VCS软件仿真平台上对所提出的向量协处理器功能进行仿真验证,通过指令功能定向测例验证本设计所实现的指令功能正确性,并使用随机指令压力测试验证包括动态调度机制在内的整体架构的稳健性。为了验证本设计对边缘计算应用的加速效果,在FPGA验证平台上分别从整数型和浮点型两个方面进行测试,以向量Intrinsic和内嵌汇编两种形式实现整数型测试程序vvadd,与标量流水线执行时间对比,分别获得了1.45和3.42的平均加速比;浮点型测例以内嵌汇编形式实现对神经网络应用中的卷积、池化和全连接进行了向量化,相比于标量流水线获得了4.25的加速比,且代码体积减少了29.7%。最后,基于在TSMC 22nm工艺库进行了逻辑综合,优化关键时序路径,结果显示本文所提出的向量协处理器最高运行频率可达917MHz,面积为180841um~2,且形式验证通过。
其他文献
进入21世纪以来,人民日常的生产生活渐渐变得与电子设备息息相关。但无法回避的现实是,大量的设备同时寻求申请频段资源使用,对于相对复杂的环境,其内部的电磁频谱资源可能极为有限,如何有效地对复杂环境内部设备进行适宜的频谱分配则成为了一项重要问题。不仅是在民用生活中,在真实的战场条件下,大量的多类别、多型号设备要在同一时间投入到一小块战场中,同时兼顾实际战场的各项需求,这就要求上层决策部门在遴选最具可行
学位
我国目前拥有世界上规模最大的高速铁路网络,截至2020年底,我国高速铁路营业里程达到3.8万公里,在世界高铁总里程的占比超过了60%。根据《新时代交通强国铁路先行规划纲要》,在未来相当长的时期内,我国仍将继续投资建设高速铁路。目前,我国面临着经济稳增长的压力和绿色转型的挑战,未来一段时期内基础设施投资仍然是稳增长的主要着力点。高铁作为重要的投资领域,其投资影响有必要进行深入的分析。国内外关于高速铁
学位
光通信传输网络具有信息容量大、抗干扰强、传输频带宽、安全性高等特点,在XX通信领域应用极其广泛。在XX通信环境下,光通信传输网络需特种数据交叉处理设备实现网络管理和监测功能。特种光通信数据交叉处理设备监测管理系统是针对该系列XX通信装备的网络管理系统。本文从XX通信需求出发,针对特种光通信数据交叉处理设备,设计并实现了一种设备监测管理系统。从功能角度,本系统包括设备管理、业务管理、数据管理、告警监
学位
呼吸肌和骨骼肌功能障碍是导致慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)患者活动能力和生活质量下降的重要原因。巴塞罗那大学发表的针对COPD患者肌肉功能障碍的评估和治疗指南,汇总了COPD患者肌肉功能障碍的病因、生物学机制、肌肉性能测试、运动能力评估以及临床治疗策略的既往文献,通过分析和总结对各部分内容作证据级别推荐。本文对该指南进行解读
期刊
创新,既是竞技健美操的生命,又是中国竞技健美操项目不断发展的必要手段和制胜法宝。该文以竞技健美操训练理论与实践创新为研究对象,采用文献资料、问卷调查、专家访谈等方法,以技术创新因素为中心,其他因素为实现这个中心任务服务为逻辑起点,提出了竞技健美操创新系统,包括技术创新系统和技术创新支持系统两个部分。并根据中国竞技健美操的发展现状,提出操化动作的六大创新路径。
期刊
中国的美学思想发端于先秦,诸子百家尤其是道家的美学观念丰富而高远。道家认为,“素朴而天下莫能与之争美”,指出真正的美不是外在的人为的虚浮与华丽,而是一种自然率真、恬淡自由。道家是第一个把超越外在的必然性而取得自由看作是达到美的根本所在。由自然而达自由是道家特别是庄子美学的主旨,为通达这一主旨,庄子以解构的方式,塑造了一系列“畸人”形象,对常俗之形体审美进行批判,进而彰显自然之美、德性之美。《大宗师
学位
随着人工智能、大数据、区块链等技术的发展,普通计算机有限的计算和存储能力已经无法满足个人及企业用户日益增长的资源需求。云计算作为一种资源网络为大量的计算资源缺口提供了一种新的解决方案,使用者可以随时获取“云”上“可无限扩展”的资源,按需求量使用,按使用量付费。然而,云数据中心在为用户提供高效计算服务的同时,也带来了大量的电力资源消耗以及二氧化碳排放。因此,云计算动态可扩展性作为保障云平台服务质量并
学位
网络空间安全上升成为国家战略,网络安全保护受到了前所未有的广泛关注和深入研究,入侵过程程式化、攻击模式样本化和操作执行工具化的传统网络攻击技术,已经能够被高效精确地识别和防御,网络攻击向着专业化、组织化和隐蔽化的方向转变发展。网络伪旗攻击通过精巧伪装和诱导欺骗等手段,干扰防御判定决策,常应用在高级持续性威胁(Advanced Persistent Threat,APT)等具体攻击之中,扩大了攻击的
学位
随着我国无人机技术的快速发展,相关产业规模也逐步扩大。特别是在低空空域逐步开放后,无人机被广泛应用于智慧农业、电网巡检、工程测绘、自然资源调查、应急救援等民用领域,发挥了积极的作用。同时,无人机也带来了巨大的安全隐患,严重威胁国家和社会安全,因此,急需建立“低慢小”无人机监管体系。脉冲多普勒(PD)雷达因其威力范围相对较广,距离维分辨率和速度维分辨率高,且抗杂波能力强,是监测“低慢小”无人机的首选
学位
<正>内部审计是审计监督体系的重要组成部分,是各单位内部治理体系不可或缺的内容,是促进各单位高质量发展的重要力量。中央审计委员会第一次会议提出,“要加强对内部审计工作的指导和监督,充分调动内部审计和社会审计的力量,增强审计监督合力”。《审计署关于内部审计工作的规定》明确规定,国家机关、事业单位、社会团体等单位的内部审计机构或者履行内部审计职责的内设机构,应当在本单位党组织、主要负责人的直接领导下开
期刊