深度卷积神经网络模型优化方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:police
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度学习模型由于其突出的学习能力已被广泛应用于诸多智能领域。然而,随着智能化技术革命的不断拓展,深度学习模型在复杂场景下的智能应用面临着两个主要挑战:(1)深度模型泛化性差。特定任务训练的深度学习模型无法有效应对终端用户产生的复杂多变场景和分布差异较大的测试样本,直接导致模型的输出性能下降;(2)深度模型规模大、效率低。由于实际应用场景下计算设备的存储和计算能力是有限的,这与深度学习模型框架复杂、计算和存储需求大矛盾。本文通过研究和拓展深度卷积神经网络泛化性和高效压缩理论,提出相应的网络正则和网络压缩方法进行模型优化,实现提高网络的泛化性、训练效率和运行效率的研究目标。本文提出的具体方法如下:(1)针对基于特征扩展的网络正则方法灵活性和针对性差的问题,提出了自适应的乘性噪声正则卷积神经网络。在该模型的正则过程中,利用可学习机制提高正则方法的灵活性;提出多尺度机制生成粒度更细的多频扩展信息;采用条件预测权重机制提高正则方法的针对性,同时可以更合理地生成扩展数据;提出自恒等映射机制提高正则方法的通用性,使其能够应用在不同结构的网络中。该正则方法可以有效地提高正则过程的灵活性和针对性。(2)针对基于特征扩展的网络正则方法训练收敛慢的问题,提出快速收敛的加性噪声正则卷积神经网络。该模型的正则过程从可学习的噪声分布中生成加性噪声代替传统乘性噪声,可在提高正则灵活性的同时降低扩展数据对样本特征的依赖,进而缩小扩展数据与原始数据的分布差异,稳定模型的训练。此外,提出块注意力机制在特征图注意力激活的局部块区域加入噪声来降低特征图的模糊程度,可以进一步稳定模型训练。最后,原始特征和噪声模糊特征通过共享卷积和采用预测权重融合输出特征的方式再次稳定模型的学习过程。与传统正则方法相比,该模型可以显著地提高网络的训练效率。(3)针对基于分组卷积的网络压缩方法存在平面维度参数冗余和底层框架实现平面卷积效率低的问题,提出超稀疏卷积神经网络。通过将二维平面卷积核稀释到三维卷积核的方式在卷积核的平面维度上对网络进行压缩。这种稀释方式可以同时提取到特征图的平面几何特征和通道差异信息,保证网络的学习能力不损失。同时,基于这种设计准则,三维卷积核的每个平面卷积核只有一个非零参数,因此网络可以完全通过平面尺寸为“1×1”的卷积操作实现,节省底层框架实现平面卷积时的“img2col”和“col2img”的操作时间,可以得到深度框架更高效的支持。所以,该网络可以在实现简单高效的基础上更有效地对网络进行压缩,提高网络的训练效率和运行效率。(4)针对基于分组卷积的网络压缩方法存在通道维度参数冗余和底层框架实现分组卷积效率低的问题,提出稀疏复用组卷积神经网络。通过将卷积核的通道维度进一步分解并得到组的维度,在不同分组间利用共享平面卷积核的方法首次在卷积核组的维度上降低参数冗余。此外,共享卷积同样可以避免使用逐通道卷积操作,进而降低分组卷积的分组数目,最终从理论和实践上实现对网络的高效压缩,提高网络的实际运行效率。另外,由于共享卷积核能在一次迭代中处理更丰富的信息,可以提高卷积核的学习能力,因此比传统分组卷积压缩网络的训练效率更高且取得更高的准确率。
其他文献
空天通信作为新一代无线通信技术和航天科技前沿领域的结合,其发展呈现卫星容量宽带化、高中低轨网络化、星地网络异构融合化的趋势。而随着高通量空天通信的发展,信息传输面临环境衰减加剧、链路动态时变、业务场景复杂多样等难点。信道编码技术是通信系统的关键底层技术,需对高通量空天通信全过程的信息传输可靠性提供支撑。但在空天通信特性约束下,传统的编码技术途径对高通量空天通信的适用性不足,对大衰减、快时变链路下的
长期以来,对于热辐射的理解依赖于普朗克理论,根据经典的普朗克黑体辐射定律,两个不同温度的黑体之间的辐射热流具有一个最大值。然而,随着热辐射理论的完善与发展,有研究发现,在一些特殊情况下,当物体间距与热辐射峰值波长相当甚至更小时,以传输波为主导的经典热辐射理论不再适用,倏逝波成为了辐射换热的主角,使得辐射换热量远超黑体辐射极限几个数量级,此类辐射换热现象被称为“近场辐射换热”。由于常温条件下物体发射
中国作为农业大国,每年在生产大量粮食的同时也会产生大量的农副产品秸秆作物,而秸秆的焚烧和堆积均会对环境造成危害。如果将玉米秸秆制作成纤维应用到沥青路面中,不但能够缓解秸秆作物对环境的污染,还能起到变废为宝、节约有限资源的作用,具有较大的环境与经济价值。但是目前如何将玉米秸秆制作成符合沥青路面要求的纤维材料还处于不同程度的研究阶段,同时对于沥青路用玉米秸秆纤维没有相应的技术标准。为此,本文将提出一种
钙钛矿太阳能电池(PSCs)在过去十年中取得了前所未有的进展,其效率已经从最初的3.8%提高到25.5%。Spiro-OMe TAD是目前高性能PSCs最常用的空穴材料,但是存在只有被充分氧化才能发挥出优异电化学性能的缺点。另外,常规添加剂Li-TFSI和TBP还会引入孔洞、离子迁移等问题,造成PSCs性能下降,稳定性降低。为了促进PSCs的商业化应用,需要开发合适的空穴添加剂或者替代物来提升PS
为了降低化工生产过程对人类赖以生存的自然环境的不良影响,开发绿色可持续的有机合成工艺已成为当下有机化学界的一大研究热点。使用电子作为一种“纯粹的氧化还原试剂”,有机电化学合成正在寻求绿色化工技术的大环境下重新兴起。对于具有多种生物活性和用途的N-磺酰基脒单元的碳-氮双键的构筑,以及在实际有机合成中应用广泛的各类官能团的选择性还原反应,传统合成方法时常要求较为苛刻的反应条件,反应体系及操作复杂,使用
开发清洁、高效的电化学转换技术可以为人类社会所面临的能源与环境问题提供有效的解决途径。电催化剂是制约电化学转换能量转化效率及原子经济性的关键因素。具有金属–氮/碳(M-N/C)结构的非贵金属单原子电催化剂因其原子利用率高和催化性能优异等特点,成为电催化领域的研究热点。如何高效地构筑单原子催化剂以及准确地建立催化剂结构与性能间的构–效关系,是目前单原子催化剂发展中所面临的挑战。本文以金属酞菁(Me
超级增强子(Super-enhancer,SE)是由连续排列的增强子串联形成的增强子簇,能够促进关键基因的表达,这些关键基因在机体发育和疾病发生过程中定义了细胞的身份。与增强子相比,超级增强子在基因组上跨度范围更广、转录因子结合密度更大以及诱导转录的能力更强。大量研究表明超级增强子在多种肿瘤中被异常激活,调控癌症中的关键癌基因,促进肿瘤的发生与发展。本文通过生物信息学方法,识别了一个在10种不同肿
结构形态学是研究结构形式的科学,通过对结构外在表现与内部工作机制的探究,力求创建更加丰富多样的结构形体,并实现一种以合理、自然、高效为目标的结构美学。结构形态学研究为空间结构的体系创新和性能优化提供了思想源泉和理论基础,对于促进我国由空间结构大国迈向空间结构强国具有重要意义。形态创建是结构形态学研究的核心内容之一,也是将结构形态学理论进行应用的主要途径,其目的是利用形态学方法生成兼具几何多样性与受
在数据流量快速增长的今天,光互连正逐渐取代电连接成为短距(服务器间、板间)甚至超短距(片间、片内)数据交换的主要连接方式。其中,片上密集无线光互连、涡旋光编码通信、涡旋光复用技术成为近年来通信以及大容量光互连领域的研究热点。片上密集无线光互连是一种背板型光互连,其能够充分发挥自由空间光互连的密度大和互连结构灵活的优势,从而在有限空间内提供更大的互连容量。涡旋光的轨道角动量(orbital angu
燃料作为冷却剂的再生冷却被认为是碳氢燃料超燃冲压发动机最佳的冷却方式。然而随着发动机飞行马赫数的提高和发动机可重复使用需求的提出,再生冷却面临着燃料热沉不足的困境。使用再生冷却通道出口高温气态大分子碳氢燃料组织超声速气膜,进而辅助再生冷却的碳氢燃料再生/气膜复合冷却方式,能够同时利用燃料的吸热和隔热两方面冷却能力,并且有望降低燃烧室壁面摩擦阻力,成为解决再生冷却困境的最佳方式之一。但是,碳氢燃料超