基于RRAM阵列的存内计算核设计研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:aiyi23_2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来以深度神经网络为代表的人工智能,在广泛的应用中取得了优异的性能,但是人工智能算法计算密集型和访存密集型的特点,导致硬件上计算和存储成本急剧增加,特别是在边缘计算任务中,急需高计算效能比的硬件支持。基于新兴非易失性存储器的存内计算架构,凭借其存储计算一体化、集成密度高和大规模并行计算的特点,成为突破冯诺依曼架构性能瓶颈的最有潜力的解决方案之一。但是,目前提出的多种存内计算核,由于受到阻值式存储器的非线性和模拟计算转换接口的制约,其计算精度和能效都不甚理想。为解决上述问题,论文分析了几种典型的存内计算核的特点及其局限性,设计了一个基于RRAM阵列8位鲁棒性的存内计算核。首先,论文采用8位二值性1T1R结构、固定读取电压和精准加权电路的RRAM阵列方案,减小RRAM器件的非理想性特性对权重量化和计算精度的影响。其次,论文提出了一个基于积分和电荷重新分配体制的积分乘法器,在完成乘和累加模拟计算的同时实现了数模转换,消除了传统的DAC接口,后置加权的方式也消除了RRAM的读取偏差,提升了存内计算的精度和能效。论文还提出了一个电容共享型SAR ADC,通过与积分乘法器共享电容,提升了整体设计的面积利用率和转换速度。最后,论文采用多种低功耗和低噪声技术优化电路设计,并给出了存内计算核的映射方案。电路仿真结果表明,所设计的存内计算核实现了7.26位的有效位数、0.78m W的功耗和1.85 M/s计算速度,对RRAM器件的非理想性特性和工艺偏差、电压/温度波动(PVT)具有很好的鲁棒性。同时,论文基于电路仿真的结果数据,进行了系统级能耗预估和网络准确率仿真,与几种典型的存内计算核和深度学习加速器设计(不具备存内计算能力)相比,所提出的设计在8位高精度模式下实现了2.23倍—7.26倍的能效提升,在Le Net和Alex Net上均获得了相对更高的识别精度。
其他文献
目的:探究早期乳腺癌发生腋窝淋巴结转移的独立危险因素,并初步建立有效的风险预测模型,指导临床治疗。方法:回顾性分析辽宁省肿瘤医院2016年6月至2017年12月收治的404例早期乳腺癌患者的临床资料,采用X2检验或Fisher确切概率法对临床病理特征与腋窝淋巴结转移情况进行单因素分析,采用多元逐步Logistic回归分析探索腋窝淋巴结转移的独立危险因素,根据各个危险因素的回归系数进行赋值,建立风险
肝病因其高传染性、高发病率严重威胁着现代人的身体健康。深度学习的出现极大的促进了肝病诊断模型的发展,然而肝病数据的高维度、高噪声问题一直是影响模型准确率和效率的
背景:头颈鳞癌是世界六大常见肿瘤之一,全世界每年有166万人诊断为头颈鳞癌,而这近半是口腔鳞癌。尽管外科水平的提高和放化疗方案的日渐成熟,五年生存率也仅达到50%。而口腔
2015年5月4日,教育部印发《关于深入推进教育管办评分离促进政府职能转变的若干意见》(教政法[2015]5号),更深层次的强调:“加强中国教学督导职能,加强各级教学督导工作力量,
近年来,越来越多的企业家开始认识到编写高质量使命的重要性。基于优化后的修辞资源理论框架,本文用定性和定量的研究方法,对比分析了2018年世界财富500强表单中各20家中企和美企的使命陈述。结果研究表明:中国企业和美国企业在修辞资源的建构和诉诸层面差异较大,在话题内容和美学层面差异较小。在使命建构层面,差异主要体现于标题结构和篇章结构。在修辞诉诸层面,美企在道德诉诸方面更注重“同质”,而与美企相比,
在高速发展的二十一世纪,随着中国改革开放进程的推进,中国与世界各国的交流日益频繁,其中经贸交流尤其突出。语言作为沟通的桥梁,此时就凸显出其重要性。除了口头交流外,其
随着社会的不断发展,青年群体从思想到行为发生了翻天覆地的变化,共青团作为凝聚青年、服务青年的主体,原有的工作方式已经难以适应新的时代要求,区域化团建这一新模式的提出
近年来,随着国内经济快速发展及经济全球化、国际化趋势进一步增强,金融活动尤其是互联网金融活动如雨后春笋般应运而生。相较于互联网金融其他新型融资活动,非公开股权融资
法律家长主义是指国家忽视当事人的意愿而运用法律手段干涉个人自由,并且把干涉会对个人有好处(good for sb)作为辩护理由或干涉动机。法律家长主义按照不同理解,可以得到不
党委信息工作是党委办公部门的重要组成部分,自1984年组建了专门的工作机构以来,为各级党政机关报送了大量有价值的信息。30多年来,全党上下各级党委信息组织体系已经发展成