深度神经网络的模型压缩与加速技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:jiaonimaqubao110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
迄今为止,人工神经网络已经经历了七十多年跌宕起伏的发展。得益于研究者们的探索与坚持,目前,深度神经网络(DNNs)在语音识别、自然语言处理、图像理解、视频分析等众多应用中均取得了突破性的成果。随着研究的不断深入,神经网络的层次不断加深,随之而来的是不断增加的计算复杂度和不断提高的计算和存储资源需求。如何把这些复杂的深度神经网络部署到资源有限的边缘设备(例如,移动电话、嵌入式设备和智能芯片)上成为一个难题。在庞大的应用市场需求的刺激下,深度神经网络的压缩与加速技术研究显得尤为重要。模型量化作为其中一项典型的技术,它可以将原来32位浮点数表示的数值转化成低比特的定点数,从而实现模型的压缩与计算加速。本文基于模型量化加速任务,以速度更快、精度更高、信息损失更小、模型更鲁棒、样本更少和异构加速等为目标开展以下研究,具体内容有:(1)针对多比特量化模型的加速问题,本文提出了基于{-1,+1}编码的量化模型分解与加速方法。该方法可以将任意多比特的量化模型分解为多分支的二值神经网络,在前向推理时每个分支可以利用二值神经网络的加速器来通过位操作实现计算加速,从而在保证模型精度的同时,又能充分地利用二值神经网络的加速效果。该方法具有训练简单、支持多种量化比特、适合硬件部署的特点。(2)针对利用混合精度量化的优化以提高量化模型性能的问题,本文提出了基于单支路序列化搜索的方法。在第三章中,我们将混合精度量化问题转化成神经网络结构搜索问题,并提出了一个可微分的神经网络结构搜索方法来对网络各层的量化精度进行搜索。在每次搜索时只对搜索空间的一个候选对象进行采样并使其参与到模型计算,从而减少计算复杂度和节约硬件资源。在搜索过程中,我们以选择确定性为指标按顺序地确定每层的量化精度,从而指数级的减少搜索空间,使搜索网络以更快的速度达到收敛。(3)为了缓解模型量化带来的信息损失问题,我们提出了基于多尺度小波表征的量化神经网络。该网络利用小波变换的多尺度特性将原始数据分解为多个频率域分量,然后对不同尺度下的分量进行量化,从而有效地缓解高频域的信息损失。多尺度小波量化具有保留更多信息、更强的表示能力、应用灵活和效果突出的优点。在实际使用时,我们可以根据实际结构在不同的层次上利用不同的小波基进行小波分解,然后根据不同的量化比特来选择恰当的量化器,以提高量化模型的效果。(4)针对量化比特或者量化策略发生调整时模型精度显著下降的问题,我们提出了一种支持热插拔位宽调整的鲁棒性神经网络。它可以在无需任何优化和微调的条件下实现在线的量化比特调整。我们利用小波分解与重构的特性,在引入少量模型参数的情况下提高模型表达的多样性,并对不同精度情况的超参进行优化学习。当进行量化比特调整时,模型会自动地选择对应的超参和支路进行计算,该过程不需要任何训练与精调,可以在秒级完成,从而达到用户无感知的热插拔调整的效果。(5)针对样本不足的情况下模型量化的需求,我们提出了基于双向误差重构的小样本训练方法。该方法是典型的后训练量化方法。经过理论分析,我们发现随着量化比特的降低,量化敏感度呈指数级增长,模型权值的分布成为量化敏感度的重要因素。基于此,我们提出了一种鲁棒性的后训练量化方法,能够在不损失模型精度的情况下,将权值参数的分布拉向对量化友好的均匀分布。然后,我们利用所提出的双向误差重构算法来进行逐块特征重构以实现对量化参数的学习,从而降低量化损失。该方法可以在低比特情况下实现目前最好的精度效果。(6)以上章节的内容均是对模型量化在不同关键问题上的理论方法研究,为了实际测试量化模型的加速效果,我们在Xilinx的异构平台上进行了验证。本章节以Xilinx的ZCU102开发板和Ultra96 v2开发板为硬件平台并且配置了一系列配套的系统。基于这些硬件平台和系统我们展开了对模型轻量化和硬件加速的实验。通过将预训练的模型进行量化、微调、交叉编译等操作,部署到异构硬件平台上测试其性能。实验表明,模型量化能显著的提高模型的推理速度,具有更高的能效比。
其他文献
广东省湛江市徐闻县位于我国南端,其菠萝年均产量在全国占比高达30%,且在2005年,徐闻菠萝入选国家地理标志保护产品,徐闻县也因此逐渐扩大知名度,吸引众多游客前来观赏,具有了极强的旅游发展潜力。但当下徐闻的菠萝产业和旅游业并不能达到很好的融合,其表现主要包括农户缺乏相关意识、基础设施不完善及政府缺乏相关政策的扶持等。因此,为了分析与解决徐闻菠萝产业与旅游业融合的问题,本文将以徐闻旅游景点菠萝的海为
心律失常是心血管疾病中常见的临床表现形式,实现心律失常的自动分类在医学领域具有重要意义。在实际临床中,医生除了提供诊断结果,还要有详细的解释来支持自己的诊断,但是现有的大多数机器学习模型都忽略了结果的可解释性。同时,之前大部分研究致力于宏观分类,实际临床意义不大。为了解决这些问题,提出了一种可解释的基于注意力的混合深度学习模型(IAHM)。IAHM通过分别提取心拍级别和心律级别的注意力特征,将医学
纵肋织纹螺(Nassarius variciferus),俗称海锥,主要分布于中国北方,产量高,价格昂贵。为了解纵肋织纹螺营养价值和特点,对其营养成分进行了分析与评价。结果表明:纵肋织纹螺肌肉中水分含量为77.61%,粗蛋白含量为14.42%,粗脂肪含量为0.94%,以及粗灰分含量为2.73%;脂肪酸测定发现,纵肋织纹螺中包含14种脂肪酸,其中饱和脂肪酸(SFA)6种,单不饱和脂肪酸(MUFA)3
李泽厚的美学思想发轫于20世纪五六十年代的美学大讨论,以其为代表的客观社会派开创了美学新局面。李泽厚将美和美感区分开,统一形式与内容。经过历史的发展,美学意义逐渐积淀在形式中,形式成为“有意味的形式”,在中国人的艺术创造中具有重要作用。线的艺术是《美的历程》中描述的经典艺术样态,被寄予情感、观念、想象等多种精神因素,它由繁入简,形式一再创新,逐渐成为中国传统审美文化中的核心组成部分。从《美的历程》
<正>教授《寡人之于国也》的时候,有学生提出这样的疑问:孟子在向梁惠王阐述完保民、养民和教民的措施以后,有一句总结性的话:"七十者衣帛食肉,黎民不饥不寒,然而不王者,未之有也。"为什么孟子在小结强调的时候没有提到教化百姓,而只是谈及物质层面所应达到的水平,并且由此断定"然而不王者,未之有也"。这是行文上的疏漏,还是孟子在谈话时的有意为之?课后,笔者查阅了《孟子》全书,发现类似的文段出现在同一章孟子
期刊
看着学生在课堂上兴趣盎然地学习,课后高兴地离开教室,我对《认识计算机》这一课的教学设计进行了认真反思:学生不是被动接受知识的机器,老师应该努力将学生培养成为主动学习的“可持续发展”的新时代学生。新时代的学生,更应该要“学会学习”。他们应该学会将每一课建立联系,能够将不同的学科相关联,将理论与实际相结合,并能学会用绘制思维导图的方式自主梳理思路,形成自己的知识网络。
<正>【文本解读】《离骚(节选)》中,诗人自叙其身世、遭遇,表达了对高洁人格的坚守和对高远理想的追求,并将个人命运与国家兴衰紧紧联系在一起。通过温习《屈原列传》,回顾屈原的政治生涯,理解司马迁心中屈原的高贵形象;品读《离骚》,把握诗歌中“香草美人”的象征意义,体味诗人的情志。诵读时,要注意诗中繁复的意象、回旋复沓的表达、独特的节奏韵律,感受其中澎湃激荡的情感。
期刊
<正>在某中学语文期刊群里,有老师提问:《孟子·梁惠王上》“寡人之于国也”句中的“之”字是什么意思?(其实这里不能用“意思”而应该用“作用”)很快便有老师回应:是取消句子独立性,助词,不译。提问的老师回应道,我看到有的参考书把它翻译为:“主谓之间取消句子独立性”。可是,“之”在主语和介宾短语之间似乎不能称作主谓之间。又有老师说,应该可以。无“之”,就是主谓关系。介词性短语,作谓语。
期刊
新收入准则中对特定模式下采用总额法还是净额法确认收入,主要是以企业是合同主要责任人还是代理人的角度进行界定。准则修订带来了收入确认和计量方式等方面的变化,对企业的会计核算产生了影响。本文从实务案例出发,对实务中的具体核算方法进行了探讨,以期对实务提供一定的参考。