基于高精度深度学习的模型简化的研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:mlgb7758521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于生物原理的神经网络在深度学习领域应用越来越广泛。深度神经网络赋予了各种智能设备新的发展空间。但深度模型往往拥有庞大的参数量并需要昂贵的计算力,这些模型难以在有限的计算、存储资源以及续航能力的智能终端设备上运行,这使得神经网络在终端部署成为新的难题。针对上述问题,本文深入研究生物进化选择原理,提出一种全新网络算法,并基于已有模型压缩方法,研究出一种新型优化学习算法。本文的工作可以分为以下三个方面:1)参数自由度对模型压缩效果有关键性影响。大规模模型中常含有海量参数,这些参数之间存在较高冗余度,通过降低这些参数的自由度能够有效缩小模型体积。首先分析模型权值参数的分布结构,验证参数之间高自由度的结论;其次对参数进行聚类,找出模型核心参数,其他参数共享对应的核心参数。实验结果表明参数自由度的降低能够更大程度降低模型占用的存储空间。2)设计一种全新神经网络算法BIO-NET。启发于生物学原理,提出“进化”、“随机”、“选择”相结合的新型神经网络算法。首先选择具有较好性能的神经网络,确保重构的网络模型具有进化能力;然后对权值参数聚类,每个类中的参数共享所在类的质心,挑出具有代表性的参数以备进一步的操作;最后在共享质心基础上结合随机微扰值进行参数重构。该算法在保持原有神经网络基础架构的情况下,能够极大简化现有神经网络模型的体量。在图像分类和目标检测两个领域观察重构模型的准确度变化并验证模型稳定性。实验结果充分表明该算法的有效性与稳定性。3)研究一种新型的蒸馏与量化联合学习的BERT优化算法(KD_DQ)。BERT模型大大提升了各类自然语言处理下游任务的性能,但其具有庞大的参数量,复杂的计算与海量的参数限制了BERT在终端设备上的应用。知识蒸馏能够很好的将体积庞大的教师网络的优秀性能传递给更轻量的学生网络。动态量化降低参数表示位数,以此降低模型计算量与存储空间。本文结合知识蒸馏与动态量化降低BERT模型的存储占用,设计一个规模小、性能优的模型。不同于已有的算法,本文在学生网络学习前进行量化操作,提高学习过程中较高学习价值的参数表现力,以此进一步优化模型蒸馏的学习效果。实验的结果证明KD_DQ算法的可用性和有效性。
其他文献
随着深度传感器和三维扫描仪的普及,三维点云得到了迅速发展。基于深度学习的三维场景理解已经成为一个研究热点。三维场景的点云数据处理包括目标分类、目标检测、实例分割、语义分割。在这些任务中,目标分类和场景语义分割都是目前研究的热点。然而,在处理点云数据时存在一些挑战。由于点的非结构化和无序性,使得研究者很难直接捕捉到点与点之间的复杂关系,一些网络只考虑到了原始坐标和单个点的特征信息,没有充分关注点云局
近年来,随着信息网络的迅猛发展,时刻都会产生纷繁冗余的数据,用户面对海量数据,可能无法准确对有效信息进行选择。因此,推荐系统作为帮助用户获取精准高效信息的必要工具应运而生。传统推荐方法容易遭受数据稀疏性和冷启动等问题,并且难以应对用户偏好以及用户与项目之间的关系随着时间的推移而产生变化的问题。矩阵分解和张量分解在推荐系统中得到广泛的应用,但二者还存在不少局限性,第一,线性模型参数的较小随机扰动可能
正例未标注分类简称PU分类,由于只有正例样本与未标注样本,传统的分类方法在PU分类中往往效果不甚理想。为PU问题构建稳健的分类是非常具有挑战性的,特别是对于负例样本压倒并且含有异常值(错误标记样本)的复杂数据。这种分类情况实际应用中十分常见,例如医疗保健,文本分类和生物信息学。尤其当数据高速发展的今天,如何快速准确的分类并实现在线学习成为当下研究中的热门,本文针对包含异常值的增量型PU分类研究如下
精确计算猪胴体中各个组织的重量和占比对于种猪育种是非常重要的,这有利于优化生产结构,培育出满足市场需求的优良性状种猪。医学影像学的发展为我们提供了许多无创的、高分辨率的仪器,其中最适合测量活体猪胴体组成的设备就是CT。CT是一种非侵入性的技术,目前已经被广泛应用于动物生产和畜体分级领域,它可以随时在猪体的生长过程中研究猪的身体构成而不必对其进行连续屠宰。CT图像使用Hounsfield units
《远山淡影》是英国日裔作家石黑一雄的处女作,作品在1982年一经出版便在西方文坛引起巨大反响。该书讲述了身处英国的日裔遗孀悦子,在大女儿景子自杀后回顾日本生活点滴的故事。主人公悦子有意虚构了佐知子和万里子这一对处在社会边缘地位的母女,来揭示日本女性在以男权为主导的日本社会所遭遇的重重压迫,以及悦子母女在母国和异乡所经历的身份困顿和压迫。《远山淡影》的一大特点是性别化叙事的运用。本文从女性主义叙事学
线性回归是机器学习中比较热门的研究方法,广泛应用于分类、识别等多个领域。由于具有形式简单、易于建模、良好的可解释性等优点,线性回归是目前应用最广泛的方法。本文提出了三种新的线性回归方法,具体工作如下:首先,论文提出基于样本特征核矩阵的稀疏双线性回归(KMSBR)。该模型利用特征映射将样本特征映射到高维空间,并构建基于样本的特征核矩阵。以样本的特征核矩阵作为输入定义双线性损失函数,同时以L2,1范数
2022年,第24届冬奥会即将在北京举办,在此背景下,冰雪运动成为新的体育消费热点。在所有冰雪运动中,花样滑冰独具艺术性,受到人民群众的广泛喜爱。目前国内女子花样滑冰表演服的部分生产企业缺乏系统的设计方法与创新意识,与国外品牌差距较大,因此针对女子花样滑冰表演服设计的理论研究日趋重要。本文梳理女子花样滑冰运动的历史,介绍女子花样滑冰表演服的概念及分类。通过分析图片、影像资料,对女子花样滑冰服从诞生
现实生活中往往存在许多不确定性的事情,但是人们对于未来会发生的事情及各种情形需要有一定的准备,即“未雨绸缪”。人们需要对未来的事态发展进行预判,即对将会发生的事情或者结果进行预测,以便更好的进行经济生产等活动。但是由于生活中实际数据的难以获取以及信息的不对称等因素,会导致有效信息量少,给实际预测带来一定的困难。要想对实际情况做到准确的预测,必须通过合理的方法解决这一问题。灰色系统理论自提出以来,便
鲁锦作为鲁西南地区传统手工纺织品的代表,在漫漫的历史发展进程中融入深厚的文化积淀从而形成了其特有的艺术风格。作为黄河文化的组成部分之一,因其独特的纹样艺术形式,高超的织造技艺,美用兼备的功能性,已于2008年被中国第二批非物质文化遗产收录。鲁锦纹样有近两千种之多,且不同的纹样有不同的名字。其纹样的艺术特征、深厚的文化内涵及鲜明的地域性特色都值得我们进行深入的研究、探讨。本课题的研究内容主要有以下几
为了方便技术人员利用校准组件对DNQ1型前向散射能见度仪进行现场校准,设计了具有校准功能的软件系统,也可用于设备故障检测。利用系统对海南省多个台站的能见度仪进行现场校准,满足了能见度仪校准的功能需求,缩短了现场校准工作时间,校准结果表明校准后信号强度值误差均在±5%范围内。在现场校准中发现能见度仪长期保持干净状态,则信号强度误差保持在±10%内;如果仪器安装在靠近马路等尘埃比较多的位置,则信号强度