基于量化卷积神经网络的模型压缩方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:ydfang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,深度学习发展非常迅速,在多个领域上深度神经网络具有最优的模型表现,然而模型复杂度越来越高,模型参数量越来越大并且训练需要大量数据支撑;由于结构特点,模型常具有大量冗余参数并且计算资源需求高昂,进一步阻碍了移动端部署和推理,目前可以通过模型压缩手段,例如模型量化来减少信息冗余和模型复杂度。模型降低了复杂度除了性能具有部分优化且势必会带来精度损失,而压缩过程中如何尽可能弥补模型精度损失是一个非常关键的问题。本文针对卷积神经网络使用模型量化以及多种模型压缩手段和问题开展研究,主要工作内容和贡献如下:针对模型参数存在信息冗余以及直接模型量化较高精度损失等问题,本文提出了一种基于知识蒸馏的渐进式量化过程优化方法,该方法将全精度卷积神经网络作为教师网络,量化卷积神经网络作为学生网络,使用知识蒸馏的思想,通过相对熵或者特征图转移方法进行教师-学生的引导训练过程,并且使用了渐进式思想从模型渐进量化,量化等级渐进,组件渐进量化等多个方面进行网络渐进量化过程,并且通过多方位多角度的分析和实验结果,可以看出提出方法和其他方法相比有效地保留原始压缩模型性能的同时减少量化模型精度损失,为后续模型量化的优化方式提供了研究方案。针对结构带来信息冗余,模型参数量较大,紧凑模型量化精度损失较高等问题,本文提出了一种基于低秩分解的渐进量化优化方法,该方法对原始卷积层引入矩阵分解进行拆分为多个量化卷积层,并且使用张量分解思想张量化全连接层来在维持紧凑网络结构冗余减少参数量的同时平衡网络模型的精度损失提升模型推理速度,且网络某些超参数例如秩的选择无需精细调整。此外为了低秩分解理论可以快速结合应用于深度学习领域,设计开发了低秩分解工具包包含低秩分解所需的基本数学操作以及多种低秩分解算法等,工具包高度模块化可以内嵌于深度学习开发框架中并且进行了试验测试和分析。最后对提出方法在多个数据集上进行实验,均取得了较好的实验结果,并且和先进方法进行对比可以看到提出方法具有的优势,同时也为紧凑网络结构进一步进行压缩提供了研究思路。
其他文献
一、前茬小麦收获与秸秆处理种好玉米,要从麦收做起。小麦收获时选用带有麦秸粉碎装置的联合收割机,粉碎麦秸长度要小于10厘米,麦茬留茬高度不超过20厘米。
以1H-吲唑-3-羧酸为起始原料,经过硝化和酯化反应制得5-硝基吲唑-3-羧酸乙酯(2);2与1-氯-二乙胺基乙烷偶联后水解成盐合成了一个新型的放疗增敏剂硝基吲唑衍生物——1-[2-(二乙
近年来,全球工业迅速发展,对能源的消耗日益剧增。由此带来的能源日益枯竭、生存环境持续恶化等问题已成为社会发展、国家富强道路上的最大障碍。2017年9月,工信部正式印发《
众多学者关于股权结构与银行绩效之间关系的实证研究结论不相一致,原因在于其分析只是基于股权结构的变化和相应的绩效变化这类相对宏观的层面,但只有能反映到信贷人员和贷款
随着社会的不断进步与发展,互联网的应用范围也更加的广泛,不仅应用到企业的办公,还应用到大学教学的过程中。基于"互联网+"模式进行大学生双创服务实践平台的构建,就是互联
随着汽车保有量的不断增加而引发的环境和能源问题日益突出,汽车的轻量化成为实现汽车节能和减排的一个主要发展方向。玻璃纤维增强热塑性复合材料GFRTP(Glass Fiber Reinfor
马克思劳动价值论是马克思经济理论的基础,是关于商品价值的完整而严密的理论体系。马克思劳动价值论从分析商品入手,系统阐释了商品价值的实质、价值的源泉、价值的形式和价值的实现,揭示了商品经济的内在本质和运行规律。马克思劳动价值论诞生于十九世纪中后期,它汲取了古典政治经济学劳动价值论的优秀成果,与此同时,资本主义机器化生产和资本主义商品经济的发展为其产生奠定了实践基础。马克思劳动价值论诞生距今已过一个半
金属玻璃作为一类新型的结构与功能材料,由于其独特的微观结构,使得金属玻璃拥有许多优异的性能,在不同的领域都有广泛的应用。长期以来,金属玻璃微观结构与弹性性能关联的研究,一直是国内外学者们研究的一个热点。其中,弹性模量与金属玻璃的结构、热力学和动力学、力学和物理性能以及稳定性方面密切相关,因此,弹性模量是研究和理解金属玻璃力学性能的重要参量。虽然,之前在金属玻璃弹性性能方面有大量的研究,并取得很大的