面向深度神经网络的数据增强和优化方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:focus2316a
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无人驾驶作为汽车未来的发展方向,其对于汽车行业和交通运输业都有着深远的影响。整个无人驾驶系统是由一系列感知、规划、决策和控制等子系统构成。其中,环境感知模块主要负责获取驾驶环境信息,一般包括摄像机、毫米波雷达、激光雷达等传感器。使用最为广泛的、获取信息最为丰富的是摄像机,它是无人驾驶汽车的“眼睛”。机器视觉技术是基于摄像机的环境感知的基础技术,而深度卷积神经网络是当前机器视觉领域的主要工具。然而,由于驾驶环境复杂,无人驾驶中机器视觉还存在许多挑战,在分类、定位、分割等任务中精度还有待提高。原因一方面是深度神经网络模型训练需要大量训练数据,而用于无人驾驶技术的数据获取成本往往较高,数据量有限,使得大型深度神经网络的泛化能力受到限制;另一方面,无人驾驶环境复杂,需要深度神经网络的训练更高效,模型泛化能力更强,以适应多变的驾驶环境。图像分类任务作为视觉感知技术的基础技术,在驾驶环境的语义分析中发挥重要作用。因此,以图像分类任务作为背景对深度神经网络进行研究有重要的理论和实践意义。随着神经网络的网络结构创新和数据表征的丰富,其模型泛化能力也得到进一步增强。但是,依靠加深网络层数的方式提高网络性能的方法已经接近了极限,越来越多研究聚焦于深度神经网络的其他技术环节。其中,深度神经网络的训练策略对网络模型的最终泛化能力有重要影响。训练策略包括了对数据的前处理、损失函数的设计、优化方法、模型的后处理等。因此,相比进一步提高网络深度或改进网络结构,对深度神经网络的训练策略进行改进,模型泛化能力有更大提高空间。数据增强算法属于数据前处理的重要组成部分。数据增强技术基于有限的训练样本,生成新的训练样本,从而增大训练样本规模。理论上,数据增强方法是在原始训练数据分布的基础上,定义出原始数据的邻域,并在邻域中提取新的训练样本,以实现数据增强。在完成数据前处理后,要拟定目标函数,采用优化算法对模型参数进行调整,以达到目标函数损失最小。在众多优化方法中,基于梯度优化方法在当前深度神经网络训练中占据主导地位,但是其依然存在许多问题,其中包括振荡、收敛速度慢等。深度神经网络的全连接层可以被视为线性系统,其可以采用最小二乘法来求解误差的近似最小值。因此,可探究将最小二乘解应用于优化方法。Moore-Penrose广义逆可以用于计算最小二乘解,且由于其解不仅使得误差最小,而且解本身范数最小,符合深度神经网络权重范数较小的要求,非常适合应用于深度神经网络的训练中。本文聚焦于深度神经网络的训练策略,包括数据增强,优化算法,模型后处理算法,将Moore-Penrose广义逆引入深度神经网络的训练策略中。具体的研究重点与创新点如下:1)提出一种新的数据增强方法。利用单隐层自编码器的解码权重对来自同一类别的训练样本分布进行拓展;接着,将激活后的解码权重与来自不同类别的原始训练样本进行线性组合,以扩展跨类别的分布。该方法所定义的原始训练样本邻域范围比其他数据增强技术所定义的邻域更大,采用该方法训练的模型可以获得更好的特征,从而提高模型分类准确率。在基于大量数据集和深度神经网络模型的实验中,该方法对模型泛化性能改进显著。2)提出一种模型后处理方法——全连接层权重重计算。采用Moore-Penrose广义逆方法,将深度神经网络的残差反向传递到每个全连接层,计算每个全连接层的理想输出偏差;根据理想输出和输入特征,采用Moore-Penrose广义逆重新计算各全连接层的权重。该方法只重新计算全连接层的权重,不涉及对网络结构修改,因此该方法适用于各类深度神经网络模型。实验结果表明,采用该方法进行后处理后的深度神经网络模型比原始模型具有更好的泛化性能。3)提出一种针对顶层全连接层的优化算法。该方法不由梯度方向主导,而是计算当前权重与最优权重的差,定义为最优补偿。权重更新先沿着最优补偿方向进行,然后采用梯度进行微调。在实验中,和其他优化算法相比,该方法收敛速度更快,且最终收敛损失更低;相应地,该方法所训练的模型与其他优化方法所训练模型相比在分类准确率上有较大优势。此外,从数学上证明了最优补偿以及该优化方法的收敛性。4)提出仅基于最优补偿的无梯度优化算法。该方法采用Moore-Penrose广义逆计算每次训练迭代中的权重更新,采用当前权重与最优权重之间的差,即最优补偿来引导权重更新,不涉及梯度对权重的更新。实验表明,在可训练权重数相同的情况下,与基于梯度的优化方法相比,该算法能够获得更高的测试准确率。此外,该方法可以在采用较高的学习率的同时保证收敛,并且对学习率设置不敏感,使其具有较高的实用价值。5)将所提方法应用于无人驾驶领域任务。将数据增强算法应用于车辆精细分类任务,该算法可以有效降低过拟合,有助于解决无人驾驶应用中训练数据不足问题。将基于最优补偿和梯度结合的优化算法用于车辆精细分类任务,在网络结构不变的情况下大幅度提高分类准确率。将仅基于最优补偿的优化算法用于国内交通标志分类,在迁移学习设置中大幅度提高分类准确率。本文所提算法对无人驾驶系统中深度学习相关应用的性能改进有重大理论和实践意义。
其他文献
雾霾作为影响中国最为广泛的环境污染方式之一,严重影响到了我国人民的身体健康。同时,日益增长的能源需求,使我国面临严峻的能源危机。而内燃机既是造成雾霾的主要来源之一,也是能源消耗的主要工具。因此,寻找高效、清洁的内燃机替代燃料,并组织合理的燃烧方式,对于解决我国大气污染与能源危机具有重大意义。天然气作为储量丰富的清洁燃料,在内燃机上应用通常有火花点燃和柴油引燃两种方式,均引起了学者们的广泛关注。仅仅
随着我国城市化进程的持续推进,城市规模逐步增大,城市发展呈现多样性、动态性、复杂性等特点,对城市科学治理提出了更高要求,数据挖掘成为一项支撑性技术,特别是智慧城市的建设和发展,亟需从海量的城市运行数据中挖掘知识以支撑各行业应用。近年来移动定位技术和无线通信技术的快速发展,使城市交通领域积累了大量的移动轨迹数据,是智慧城市的重要研究对象之一,已经成为除图像、视频、音频等媒体数据之外的一种新型数据。海
学位
本文旨从“中原文献之传”这一独特视角,探讨吕祖谦如何重建儒学学统。宋学的问题意识是重建内圣外王之道,而吕祖谦的中原文献之学正是对这一时代问题意识的回应。吕祖谦将传统思想之继承与时代思想之变革结合起来,走了一条以儒学学统为骨骼、以义理、辞章、考据、经济为血脉的儒学复兴之路。这条路既有别于朱熹以天理论为核心的宇宙本体论建构,又迥异于陆王挺立心本体所构建的意义世界。他以“中道”作为贯穿本体世界与意义世界
边界元法以其高精度、降维、自然地求解奇异性问题和无限域问题等特点,已被广泛应用于工程和科学问题的各个研究领域。但是,边界元法采用常规的拉格朗日单元近似几何变量和物理变量,显然会引入几何误差,从而降低计算精度。边界面法同样是以边界积分方程为理论基础,但直接在CAD模型上实施。因此,边界面法不仅继承了边界元法的所有优点,还避免了几何误差,从而自然地将CAE与CAD融为一体。在分析具有小特征或者薄型区域
随着计算机技术的飞速发展,各行各业的数据以指数形式爆炸式增长。大数据时代已经来临,给互联网行业带了巨大的机遇与挑战。一方面,大数据资源蕴含着巨大的社会价值和商业价值,有效地管理这些数据、挖掘数据的深度价值,对国家治理、社会管理、企业决策和个人生活将带来深远的影响。另一方面,大数据有着数据量大、增长快、类型多、难辨识和价值大密度低等特征,传统的数据处理系统和技术已经很难满足大数据处理的需求。当前,并
大政办发[2016]96号各区市县人民政府,各先导区管委会,市政府各有关部门,各有关单位:为进一步做好中山区、西岗区、沙河口区、甘井子区(以下统称市内四区)经营性建设用地招商引资工作,着力提升城市功能和品质,促进经济社会持续健康发展,根据国家和省、市相关规定,经市政府同意,现提出如下意见:一、指导思想全面贯彻党的十八大和十八届三中、四中、五中全会精神,牢牢抓住新一轮东北老工业基地振兴等重大战
期刊
随着复合材料力学与损伤理论、制备工艺、试验方法和数值计算模型的发展与完善,复合材料在工程机械结构或仿生结构中得到了广泛的应用。为了满足复杂的工况和多样的载荷条件,对复合材料的力学性能与损伤机理的研究越来越要求精细化。卷曲或螺旋纤维因其特殊的结构形态和分布特性使得以其为增强相的复合材料在拉伸载荷下可吸收拉伸应力;在卸载时可像弹簧一样,释放应变能从而减少蠕变的影响。同时,空间卷曲纤维结构广泛存在于血管
依据说服理论,审判人员在科学证据审查认定过程中,存在中央路径与外围路径两种不同的决策路径选择,当审判人员选择中央路径时会依据科学证据实质内容所提供的信息做出可靠性认定决策,而当选择外围路径时则会依据科学证据实质内容以外的启发式信息做出可靠性认定决策。且依据相应证据学理论基础,以及即行的证据制度与规则,民事诉讼中的审判人员在科学证据可靠性认定方面具有较大的自由裁量空间,因此存在审判人员依据其所具有裁
新时代是中国发展新的历史方位,是政治、经济、文化、社会等状况发生具有进步意义的重大变化的历史时期。家庭德育是在“家庭场域”中培育和发展孩子的道德、思想、政治、理想、爱国精神、民族情怀、集体意识、民主理念、法治观念、心理素质的教育活动。新时代国家发展中的新形势与新变化,以及家庭德育本身存在的许多与客观规律相违背的因素、不合时宜的因素、效率低下的问题等,呼唤家庭德育变革。变革,是一个“变”的过程,又是