基于深度学习处理器的Top-K算法实现及应用

来源 :中国科学院大学(中国科学院大学人工智能学院) | 被引量 : 0次 | 上传用户：maomao68

【摘要】

：

【作者】

：

牛丽玲

【出处】

：

中国科学院大学(中国科学院大学人工智能学院)

【发表日期】

：

2020年01期

【关键词】

：

Top-K查询多核深度学习处理器性能优化

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

当今,海量数据的积累已经给数据存储和数据分析造成了极大的压力。然而海量数据的不断积累,并不意味着信息价值的积累。Top-K查询能够实现海量数据的筛选,但是传统Top-K查询算法处理海量数据的性能较差,已无法满足人们对性能的要求。随着深度处理器技术的发展,处理器性能不断提升,为深度学习模型训练和推理提供了强大的算力支持,而这一特点正是进行Top-K查询性能提升的关键。本文以DianNao系列处理器为研究背景进行分析,结合深度学习处理器硬件特性设计实现基于深度学习处理器的Top-K查询算法。本文主要研究内容为:(1)设计实现基于深度学习处理器的单核Top-K查询算法;DianNao系列处理器底层支持了深度学习中常用张量指令,能够在一个时钟周期内完成批量数据的比较,极大的提升了数据处理并行度。根据深度学习处理器中maxpool指令和minpool指令的特点,设计实现基于深度学习处理器的单核Top-K查询算法。通过实验对比发现,在中大型规模下,基于深度学习处理器实现的Top-K的查询性能约是基于CPU实现的Top-K查询性能的20倍。(2)设计实现基于深度学习处理器的多核Top-K查询算法;采用向量指令进行数据筛选,能够极大的提升数据的筛选速度。为充分发挥深度学习处理器的优势,对Top-K进行了指令级并行优化,约将单核Top-K数据查询性能提升为原始的1.6倍,多核Top-K性能提升为原来的1.2倍。对100万数据规模进行Top1000查询,优化后的多核Top-K性能约为CPU的36倍,约为GPU性能的2倍,证明基于深度学习处理器进行Top-K查询性能提升是可行的。(3)完成tensorflow深度学习处理器框架扩展,将Top-K运用到Faster-RCNN网络中;首先完成Top-K算子的注册和封装。将原始CPU实现替换掉,结合面向深度学习处理器的Faster-RCNN离线模型特点进行模型处理,之后运行Faster-RCNN网络。对比算子替换前后Faster-RCNN模型的精度,发现替换后依旧能够保证网络运行正确,验证了基于深度学习处理器的Top-K算子的可用性。

其他文献

行政裁判中目的解释研究

目的解释是众多的法律解释方法之一,是以法律所要实现的目的为依据去解释法律的一种法律解释方法,它能够在法律有缺陷时帮助法官跳出法律文本的桎梏。在包括行政判决、行政裁定的行政裁判中应用目的解释,有避免对法律的机械解释、明确法律条文的不确定含义、补充法律漏洞、修正法律的明显错误等功能,并达到加强裁判文书中论证说理逻辑性的效果。本文以四个部分对行政裁判中目的解释进行研究。第一部分中由“北雁云依”案引出目的

学位

行政裁判法律解释目的解释指导性案例

MoAl0.97Si0.03B固溶体的制备及性能研究

MoAlB具有较好的力学性能和高温抗氧化性,它有望成为高温构件的优选材料。为进一步提高MoAlB的力学性能,引入Si元素形成MoAl（Si）B固溶体,达到固溶强化的目的;另外,固溶的Si元素

学位

MoAl0.97Si0.03B固溶体热压抗氧化性自愈合

中国-东盟交换第五航权的法律问题研究

随着中国“一带一路”与“空中丝绸之路”的建设以及中国—东盟自由贸易区的建立与发展,中国与东盟之间的航空旅客与货物运输需求不断增大。中国与东盟之间广阔的航空运输市场急需一种更加开放、便利、自由和一体化的航空运输体系来支持人员与货物的流动。我国与东盟于2010年11月19日正式签署了《中国—东盟航空运输协定》及其《一号议定书》,开放不受限制的第三及第四航权。为了进一步实现区域航空自由化,2013年12

学位

中国—东盟航空运输协定第五航权航权行使第七航权

基于事件触发机制的离散系统输出反馈控制与故障检测

网络控制系统(networked control systems,NCSs)是集通信、计算和控制于一体的闭环分布式控制系统,通过共享网络传递信息,能够降低系统安装与维护的难度和成本。然而,NCSs中

学位

事件触发机制输出反馈控制故障检测欺骗攻击

基于双种群遗传算法的装配线平衡优化研究

产品装配是产品由原材料或配件输入到最后产品产出的最终关键步骤,一般家电及其他电器类企业,其各类型产品部件和原配件大部分都是交由配件生产商进行,所以在企业本部最重要的就是完成总装工序。在目前仍需大量使用人工劳动力的企业中,装配线的平衡率问题依然是生产浪费中亟待解决的问题。据相关数据统计分析,总装作业占据10%-40%的劳动力比例,并且也占生产制造成本中很大的比例。而尽管是工业技术比较发达的国家,在产

学位

装配线平衡工业工程平衡优化双种群遗传算法Matlab仿真

句容市政府对中小企业扶持政策优化研究

中小企业在稳增长、促改革、调结构、惠民生、防风险等方面发挥了重要作用,作为国民经济生力军的作用也日益凸显。但由于缺乏资本要素,和大型企业相比,中小企业在市场竞争中处于弱势地位,需要政府进行扶持帮助。2020年,受新冠疫情影响,中小企业受到较大冲击和影响。中央和地方各级政府相继出台一系列政策和措施,调集多方力量,为中小企业的发展“保驾护航”,坚定企业克服困难的信念。各地政府机关在中小企业发展的进程中

学位

句容市中小企业扶持政策

A市邮政集邮产品营销策略研究

党的十九大报告指出:只有文化的繁荣复兴,才有高度的文化自信,才能最终实现中华民族的伟大复兴。只有坚持不懈走中国特色社会主义文化发展道路,提高全国各族人民的文化创造力

学位

邮政公司集邮产品市场营销

系统哲学视野下右玉生态建设研究

人与自然的关系始终是人类社会关注的问题。对生态问题的治理不仅是满足人类生存的需求,也是实现人与自然和谐发展、建设社会生态文明的重要基础。当前生态环境问题包括水土流失、土地荒漠化、森林和草地资源减少及生物多样性减少等。生态系统由多种因素组成,结构庞大而复杂,对生态环境问题的治理是一项巨大的系统工程。山西省右玉县生态环境曾遭到严重的破坏,经过70多年的生态治理、建设后,使右玉县从“不毛之地”变为“塞上

学位

系统哲学右玉生态系统演化机制生态建设

几类时滞基因调控网络的全局指数稳定性分析

目前,基因调控网络的主要研究热点之一是通过建立数学模型来研究基因调控网络的内部机制.同时由于不同的基因调控网络模型可以用来定量地描述不同有机体的动力学行为,这更加能帮助人们搞清不同基因之间相互作用的机理.所以,建立合理有效的网络模型对于我们更好地研究基因调控网络非常重要.本文主要研究了三类具有常时滞的耦合基因调控网络模型的全局指数稳定性.第一,研究具有常时滞的耦合循环基因调控网络的全局指数稳定性.

学位

基因调控网络时滞耦合非负平衡点全局指数稳定性循环结构中心结构

具空间异质性的捕食者-食饵模型分析

近年来,关于反应扩散捕食模型的研究已经成为生态学与生物数学的重要课题.在关于捕食模型的研究中,Allee效应和食饵保护域受到很多学者的关注,因为在保护濒危物种和维持生物多样性等方面具有一定的应用价值.基于此,本文主要考虑两类具Allee效应和食饵保护域的反应扩散捕食模型,主要工作如下:一、简要概述了课题背景与研究现状,建立了本文考虑的两类具Allee效应和食饵保护域的反应扩散捕食模型,并引出本文的

学位

反应扩散捕食模型Allee效应保护域稳态解稳定性

基于深度学习处理器的Top-K算法实现及应用

其他学术论文