存算一体化的发展现状、挑战与对策

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:laden167
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  2019年9月,世界计算机大会在湖南长沙召开,存算一体化成为会议的热点议题之一。冯·诺依曼体系自20世纪30年代被提出后一直作为经典计算机架构沿用至今,然而,近年来随着数据量的日益增长,CPU运算能力不断提升,内存的访问延迟却几乎没有提升。在传统架构下,存储与运算之间数据交换通路窄、能耗高的问题日益凸显,存算一体成为现阶段满足高带宽、低功耗计算需求的一条有效途径。
  存内计算的发展现状
  存算一体化成为缓解存算调用低效的有效方案。在冯·诺依曼架构中,存储器与处理器是两个完全分离的单元,处理器根据指令从存储器中读取数据、完成运算,并存回存储器。两者之间数据交换通路窄以及由此引发的高能耗两大难题,在存储与运算之间筑起了一道“存储墙”。存算一体化则是将计算机中的运算从中央处理器转入内存中进行,可大幅降低数据交换时间以及计算过程中的数据存取能耗;其技术路线可分为片外存储与片内存储两大类。片外存储即基于数字芯片和存储器配合的存算一体技术,通过在存储器中植入计算芯片或者逻辑计算单元来提高读写速度。片内存储即数模混合的存算一体技术,通过在存储器嵌入算法权重,使存储器具备算法功能,实现真正意义上的将存储和计算完全结合在一起。
  人工智能热潮为存算一体化的应用带来新空间。存算一体的雏形概述出现在20世纪90年代,一直被认为是很有潜力的革命性技术,但对其应用的必要性始终缺乏论证,因此尚未在处理器与存储行业得到产业化应用。随着基于深度学习技术的人工智能应用热潮再次涌起,冯·诺依曼架构的“存储墙”问题也随之日益凸显。例如,深度学习模型的每一层神经网络运算都面临大量存储调用,每一次读取权重值都相当于做了一次乘加累积运算,90%以上的运算资源都消耗在数据搬运过程中。存算一体化尤其适用于此类数据访问密集的应用场景,可以为人工智能芯片的产业化发展提供有效助力。
  存算一体芯片市场广阔,国内外企业、科研院所纷纷布局。据Gartner预测,全球内存计算市场规模将以每年22%的速度持续增长,2020年底有望达到130亿美元。在企业层面,英特尔、博世、美光、Lam Research、微软、亚马逊、软银都投资了NOR闪存存算一体芯片。其中,英特尔发布的傲腾固态盘采用片外存储技术,实现了CPU与硬盘之间数据的高速搬运,从而平衡了高级分析和人工智能等大规模内存工作负载的性价比。国内的知存科技、新忆科技等初创公司也进入存算一体市场,其中知存科技开发的超低功耗语音识别存算一体芯片采用片外存储技术,与普通专用芯片相比,其算力可提高10~50倍。在科研院所层面,加州大学圣芭芭拉分校谢源教授团队致力于在新型存储器件ReRAM(阻变存储)里面实现计算的功能研究,即PRIME架构。清华大学刘勇攀教授团队和汪玉教授团队均参与了PRIME架构的研发,目前已实现在150nm工艺下流片,在阻变存储阵列里实现了计算存储一体化的神经网络,功耗降低至原来的1/20,速度提高50倍。此外,清华大学与SK海力士联合成立了智能存储计算芯片联合研究中心,未来五年,中心将致力于研发存算一体与近存储处理技术。
  存算一体化面临三大挑战
  计算精度有限。现有浮栅存储器件并不适合用于计算,且片内存储本质上使用模拟计算,计算精度会受到模拟计算低信噪比的影响,通常精度上限在8bit左右,而且只能做定点数计算,难以实现精准的浮点数计算。因此,并不适用于需要高计算精度的人工智能训练场景,而仅适用于嵌入式人工智能等对能效比有高要求且对精确度有一定容忍的场景。
  应用落地场景边界条件限制较多。存内计算仅适合原本就对存储需求较大的场景,对于本身存储需求并不高的场景,为了引入内存计算而加上一块大内存反倒会增加成本。尤其是随着内存容量的增加,内存成本往往呈指数级增长,且内存容量有上限,性价比不理想可能导致内存计算无法惠及更多用户和更多场景。目前来看,在人工智能仍在探寻应用场景的前提下,存算一体化的落地问题,仍需紧密结合应用场景进行具体分析。
  芯片开发生态亟待打造。存算一体芯片产业化尚处于起步阶段,目前仍面临产业链上游支撑不足、下游应用不匹配等诸多困局。在芯片设计阶段,由于存算一体芯片区别于常规的芯片设计方案,所以目前市面上没有成熟的专用EDA工具辅助设计和仿真验证;芯片流片之后,也没有成熟的工具协助测试;在芯片落地应用阶段,暂时没有专用的软件与之匹配。因此,亟需围绕存算一体化打造芯片开发生态。
  对策建议
  把握技术路径转换机遇,加快存算一体技术研发步伐。聚力发展高带宽内存、新型非易失性存储器等存算一体技术,着力突破存算一体模拟信号误差、高效模拟/数字信号转换等关键技术。引导高校、科研院所与企业成立联合实验室,加强存算一体芯片原型设计、验证、流片加工等技术工艺储备,加快存算一体芯片产业化进程,推动其在人工智能、物联网等领域应用,打造我国的长项优势。
  制定全面且长期的存算一体发展战略。建议在“十四五”及中长期集成电路研发与产业化布局中,将存算一体作为重点发展方向,编制存算一体技术发展路线图。加大存算一体研发支持力度,在01专项和集成电路、人工智能相关产业化专項中予以引导支持。拓展存储设计类初创企业的融资渠道,对于标志性成熟产品,推动国家基金和社会资本跟投。强化高校、科研院所、芯片设计企业、晶圆厂、生产制造企业、封装测试企业、整机企业之间的联动效应,构建存算一体产业新生态。
其他文献
习近平总书记在庆祝中华人民共和国成立70周年大会上重申“坚持人民主体地位”并热情讴歌“伟大的中国人民万岁”。那么,“人民”的概念究竟从哪里来?中国共产党如何认识人民?中
报纸
创新话题的经久不衰,不断为学术界引入新的论题。从单一主体的创新到跨主体的协同创新,从日趋成熟的协同创新理论到协同创新绩效的衡量。以中国知网收录的111篇与协同创新及
文章从过程和方式上来构建死刑复核法律监督机制:死刑复核法律监督程序的启动、死刑复核法律监督的过程和方式、死刑复核法律监督结果的处理。应对现行有关死刑复核法律监督
我们知道,运用标准的Galerkin方法求解方程-εΔu+α·▽u=f,当ε《h·|α|时,所得到的近似解将出现振荡。为得到稳定的解,除了FEM、SUPG等方法外,近年来又出现了起泡法。同
基本案情$$某日,在某地的一家KTV内,王某与杨某因争包厢发生争吵,随即双方约定在楼下群殴。在群殴过程中,王某一方的人员从停车场的车中拿出刀棍等武器追打杨某一方的人员,杨某等
报纸
【案情】$$被告人王某某为牟取不法利益,采取向消防、市场监督管理部门等举报、投诉的方式,利用多家超市卖场、亲子教育机构为维护经营希望不被举报、投诉或撤回投诉等心理,胁迫
报纸
从群众最渴望解决、最难办的事情上改起,什么事难办,就办什么事。群众和企业办事的堵点和痛点,就是改革的切入点和出发点。$$山西公安审批服务便民化改革坚持换位思考,从群众的视
报纸
异构聚合签密既能够实现不同密码系统之间信息传输的机密性和不可伪造性,也能够降低通信开销。结合车载网的特点,提出了一个无证书密码系统到基于身份密码系统的异构聚合签密
【数字解题】$$ 全国留守流动儿童将近1亿人城乡流动儿童规模达3581万人$$ 5月初,中华全国妇女联合会发布《全国农村留守儿童、城乡流动儿童状况研究报告》,全国有6102.5
会议
动力锂电池成组技术是新能源汽车关键技术之一,动力电池系统的性能决定了整车安全性、续驶里程以及使用寿命等关键评价指标。目前动力电池在整车应用中存在诸多安全问题,适宜的工作区间温度是动力电池有效发挥良好性能的基本条件,因此优化电池组散热结构对于提高整车安全性和性能具有重要意义。目前,车用动力电池包大多数采用单一的冷却方式进行散热,在电池组内部最高温度及最大温差控制方面表现较差。本文研究重点是基于CFD