面向FPGA卷积计算多访存模式的存储阵列架构研究

来源 :曹存存 | 被引量 : 0次 | 上传用户:harrydu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,卷积神经网络(CNN)在计算机视觉领域得到了广泛的应用,可编程逻辑门阵列(FPGA)由于可重构,高并行,开发周期短等特点被广泛用于CNN硬件加速。CNN的核心计算是卷积,过程中涵盖大量可复用的数据,然而传统行操作的存储器取数时不能有效复用数据,还需利用行缓冲结构为其内缓存的特征值数据开窗,同时滑窗操作也导致大量数据被频繁的访存,造成较大的访存开销。由此提出对FPGA中基本存储单元块BRAM进行合理组织,构建为支持多种访存模式的存储阵列,使其能探索存储数据的局部特性,有效复用数据,从而降低卷积计算时访存开销。通过对FPGA中BRAM深入研究后,提出了两种以BRAM为基本单元适用于卷积计算时复用数据的存储阵列架构。首先根据FPGA中BRAM按列分布的特点,从下到上将相邻BRAM级联(cascade),并根据访存速度要求插入流水,构建为符合设计要求的多访存模式的存储阵列。由于FPGA中固有的cascade特点,当流水线存储阵列级联路径较长时,存在访存延迟过大的问题,为了解决这个问题,提出一种带旁路结构的存储阵列,通过旁路引导访存流走向,有效降低了 FPGA中原cascade结构的访存延迟和功耗。其次,利用矩阵分块管理方式构建第二种存储阵列,并通过硬件控制电路,使其能实现多模式访存。这两种阵列均可有效访问所需局部数据信息,用于卷积不但能有效复用其卷积计算中的数据,还能省掉传统方案中行缓冲的开销。最后将传统方案在FPGA上进行复现,在给定的条件下对三种方案进行测试得出结论,本文两种方案较传统方法分别能降低15%和1 7%的功耗。此外,在完成存储阵列设计的基础上,设计实现了一款支持多通道访问的存储器接口,可用于以总线的形式访问存储阵列,为了验证该接口的优势,又利用官方IP搭建了基于AXI访问的存储阵列,并标记为baseline。最后搭建了存储接口的测试平台,分别在不同的数量的主从设备配置下对两工程进行了分析比较,结果表明本文的存储器接口所使用的可编程逻辑资源更少,且功耗也更低。
其他文献
<正>中药热奄包疗法是指将加热后的中药包置于人体局部或穴位上,借药力和热力共同作用使药性通过皮毛腠理,循经运行,以达到温经通络、调和气血、散寒止痛、活血祛瘀的一种中医外治方法。现有的热奄包大多将保温件和中药包混在一起装入棉布袋进行加热,之后用于患者热敷,导致热敷后的棉布袋不易清洗消毒,每次更换中药时连同保温件一同更换,成本较高,且使用时费时费力[1]。为降低制作成本,节省临床操作时间,省时省力,提
期刊
苏珊·桑塔格是美国著名的女作家、艺术评论家,是欧洲文化的热爱者,又是先锋艺术的领路人。她在文学评论和文学创作方面颇有建树,她的文学批评具有前瞻性和经典性,她的文学创作具有真诚的道德关怀和深刻的人性思考。她是一位母亲,又是一位同性恋者,独特的身份和经历让她的作品中充满着女性主义的关怀,本文主要选取苏珊·桑塔格三部代表作品《在美国》、《火山恋人》和《床上的爱丽丝》进行研究,探究其中蕴含的生态女性主义意
学位
为建立一种口蹄疫病毒(FMDV)O型、A型和Asia Ⅰ型三重实时荧光定量RT-PCR检测方法,本研究在比对多条FMDV基因的基础上,根据2B基因的最优保守区,设计O型、A型和Asia I型FMDV通用的反转录引物;再根据VP1基因的比对结果,以变异区为扩增靶区域,设计3对分别针对O型、A型和Asia Ⅰ型FMDV的特异性引物和TaqMan MGB探针。经优化反应体系和扩增程序等反应条件,建立一种
期刊
为统一数据标准,推进企业数据治理工作,强化信息化建设,文章根据数据标准建设现有问题,以元数据为基础,搭建了数据标准管理平台,为数据的有效管理提供平台支撑。文章详细探讨了平台的总体架构、功能架构、技术架构和关键模块的设计,为后续类似研究提供参考。
期刊
我国电动汽车在整车系统集成开发、动力系统集成以及动力总成关键零部件技术等方面取得了较大进步。随着市场热度持续升温,电动汽车市场占有率不断扩大,电动汽车产业正进入高速发展阶段。与传统燃油车相比,电动汽车目前还面临诸多问题,制约产业的良性发展,比如续航里程较短、充电时间偏长等,都是整个业界关心的问题。车辆的整备质量是影响续航里程最重要的因素之一,汽车轻量化已经在《中国制造2025》汽车发展的整体规划中
期刊
目的:随着对阿片类药物多种不良反应的日益关注,加之以患者为中心的加速康复外科(ERAS)理念快速推广,以低阿片化为目标导向的围术期多模式镇痛方案已成为专家共识。然而,由于缺乏对现有证据的全面定量评价,妇科腹腔镜手术围术期疼痛管理的最佳镇痛方案尚不明确,一定程度上限制了以循证医学证据为基础的ERAS实践的发展。本研究的目的是进行一项系统评价和网状Meta分析,为选择最佳围术期镇痛方案的临床决策提供更
学位
现如今,网络入侵已经转变为包含多个单独攻击的复杂攻击,利用多个节点进行攻击,这些攻击被称为多步网络攻击。传统的入侵检测系统只能捕获某个时间段内存在的攻击警报信息,无法将检测到的单个攻击阶段进行关联整合。并且,入侵检测系统检测的警报信息存在大量误报,以及一些低攻击性的攻击有可能被忽略掉。此外,攻击行为发生过程复杂,现有建模方法无法细粒度地反映攻击发生过程,缺乏形式化建模和脆弱性分析方法。针对以上情况
学位
期刊
期刊
早期的电路设计,尺寸小,工作频率较低,功耗并不明显,随着半导体工艺节点的降低和系统设计复杂度的不断提高,功耗在集成电路设计方面的重要性不断凸显,低功耗物理设计在工程领域具有重要的实用价值和研究意义,引起了半导体从业者的广泛关注。本论文的研究是基于晶晨半导体(西安)有限公司实际项目的需求,使用TSMC 6nm工艺,在低功耗布局方面,采用多电源多电压域和电源门控技术,在低功耗时钟树方面采用时钟门控技术
学位