基于隐变量增强的图像分类数据有效学习算法

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:tnzx911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去的许多年里,人们在图像分类(Image categorization)领域已经取得了巨大进步,尤其是基于卷积神经网络(Convolutional neural network,CNN)的图像分类算法,在现有的图像分类任务上取得了最好的性能。然而,现有的基于卷积神经网络的图像识别算法都基于两个假设:第一个假设是存在着一个大规模的(large-scale)的图像训练集用于训练整个卷积神经网络;第二个假设是来自测试集的图像样本和训练集的图像样本都是独立同分布的(Independent and identically distributed,i.i.d.)。然而,在现实生活的一些应用中,并不存在一个大规模的训练集。换句话说,人们不得不利用少量的样本来训练一个卷积神经网络。这类问题被称为数据有效学习(data efficient learning)问题。本文关注的问题是图像分类中的数据有效学习问题,亦即,在样本不充分的情况下的,我们训练一个卷积神经网络以执行图像分类任务。为了解决这问题,一种直觉就是利用增加样本个数的方法,进而解决样本不充分的问题。为此,这篇论文创新性地提出了隐变量增强(Latent variable augmentation)算法,即通过隐变量增强算法,间接地增加训练样本的个数,进而提升在样本不充分下的图像分类精度。本文首先提出了两种基于隐变量增广的图像识别数据有效学习算法。第一个方法称为基于生成对抗网络的隐变量增强算法(latent variable augmentation method based on generative adversarial networks,Lavagan)。第二个方法称为基于变分自编码的分类算法(classification method based on variational auto-encoders,Cevae)。这些算法主要包含了两个任务:一个是基于自适应隐变量分布的隐变量增强任务。通过这个任务,一方面,我们可以得到多个可靠的隐变量分布;另一方面,基于这些隐变量分布人们可以增加样本的个数,并以此提高模型的泛化能力;另外一个任务是将增强的隐变量应用于分类任务中。接着我们考虑了上述的两个任务,进而为上述两种算法分别提出了一个统一的目标方程,以使得上述的两个任务相互协作。再而,为了求解模型的参数,本文分别提出了一个交替双玩家最小化博弈优化算法(Alternative two-player minimization game optimization method)以及变分随机梯度下降(Variational statistical gradient decent,VSGD)来最小化上述目标方程,最终求出模型的参数。进一步地,为了证明算法的有效性,这篇论文分别使用了霍夫丁不等式(Hoeffding’s Inequality)和切尔诺夫界定方法(Chernoff Bounding method),分析了算法的经验误差上界。最后,我们在现有的图像数据集上实施了本文提出的算法,并且与现有的算法进行比较。实验发现本文提出的Lavagan算法和Cevae算法在数据有效学习问题设定下能对数据作出预测,这表明了算法的可行性。此外,与现有的算法实验结果进行比较,本文提出的Lavagan算法和Cevae算法输出了更好的性能,这验证了 Lavagan算法和Cevae算法在面对数据有效学习问题时是有效的。本文的主要工作可以总结成如下四点:(1)我们创新性地提出了两种不同的隐变量增强算法,分别是Lavagan算法以及Cevae算法,以解决图像分类数据有效学习问题。通过隐变量增强,人们可以提高在样本不充分情况下卷积神经网络的泛化能力。并且据我们所知,本文是第一个提出通过隐变量增强思想以提高在图像分类数据有效学习这个问题下的分类器性能。(2)在本文提出的Lavagan算法以及Cevae算法中,我们分别为其提出了一个统一的目标模型。这个模型主要关注了两个任务。第一个任务是,模型从一系列自适应并且受约束的隐变量分布中采样出大量的隐变量。第二个任务是,模型将上述采样得到的隐变量用于训练一个图像分类器。为了优化上述目标模型,本文分别利用了交替双玩家最小化博弈优化算法以及VSGD算法,通过最小化上述目标模型,进而得到算法的参数。(3)为了从理论层面上验证本文提出的隐变量增强算法面对数据有效学习问题时是可行的且有效的,我们使用了霍夫丁不等式和切尔诺夫界定方法,分析了本文提出的基于隐变量增强的图像分类算法的经验误差上界,以及传统卷积神经网络的经验误差上界。通过对比人们可以发现,本文提出的算法的经验误差上界小于传统的卷积神经网络的经验误差上界。这表明,本文提出的算法是具有可行性以及有效性的。(4)为了从实际应用中验证本文提出的隐变量增强算法面对数据有效学习问题时是可行的且有效的,我们在现有公开的图像数据集上实施了本文提出的Lavagan算法以及Cevae算法,并且将结果与现有的针对样本不充分的图像分类算法的实验结果进行比较并且对结果进行分析。经过比较,人们可以发现对比其他算法,本文提出的算法取得了更好的分类性能,并且本文提出的隐变量增强算法具有可行性。
其他文献
随着荧光粉材料的研究、应用与发展,荧光粉材料逐渐被功能化的应用于人类生活的各个领域,主要包括:医学、信息存储、防伪、照明、植物学等领域。换而言之,荧光粉材料正在很多
评价系统是马丁等学者对系统功能语言学人际意义研究的拓展,是对人际意义的横向和纵向的延伸。他们将词汇研究纳入到篇章语义学中,进而建立了此系统。态度系统是评价系统的核
核电厂是利用核裂变产生的能量来发电的场所。在核电站的众多设备中,通风设备是保证核电站正常运行的关键设备之一。其主要作用是为设备创造安全的运行环境,控制污染气体的排
岩土工程中非饱和土膨胀土隆起变形分析方法主要包括经验法、固结试验法、吸力法和数值法。多物理场耦合分析数值法因具有考虑因素多、处理复杂问题能力强等诸多优势,广泛用于土体多物理场耦合复杂分析的问题中。为了准确分析并预测非饱和膨胀土隆起变形的问题,本文基于水-热-力耦合理论方法,研究并建立求解非饱和膨胀土隆起变形的偏微分方程组与相应的数值模型。据此,开展了如下主要研究工作。(1)采用非饱和土力学理论,考
离心预制混凝土柱(CPCC)是一种新型的组合结构。CPCC在工厂预制,运至施工现场,可减轻空心预制段的起重重量,减少模板,缩短施工周期,避免钢筋工程,简化安装过程。混凝土灌入空心截面后,构成柱的材料不是单一的材料。两种不同类别的混凝土的接触面形成了一个复合结构。空心预制柱和现浇混凝土在受压过程中,在两种材料的界面处发生粘结剪切破坏时,其轴向应力和变形会产生差异。本研究主要分为界面剪切试验和轴压试验
随着近年来老龄化问题的日益严重,老年人的室内居住环境与其健康的关联性研究已逐渐成为焦点。心血管疾病作为老年人人群中发病率和致死率最高的疾病,可以用来表征老年人的健康状况;高血压作为增加心血管疾病的主要风险因素,往往采用血压作为老年人心血管疾病的量化指标。本文利用实测调查和统计分析方法探讨了室内环境与心血管疾病的关联性问题,并通过机器学习方法分别建立了室内综合环境因素对心血管疾病和高血压的风险表征模
目前机匣件材料主要为高温合金等难加工材料,如何有效地提高机匣件的加工质量及效率已成为亟待解决的问题。首先,针对高温合金机匣件车削时刀具磨损严重的问题,为选择合适的
针对高超声速飞行器输入环节中大时滞和输入受限的控制难题,本文从算法的设计和改进方面做了探索性研究工作。大时滞和输入受限会使控制品质大为下降,导致系统出现调节时间过
软岩巷道支护一直是地下采掘活动的难题之一,是影响矿井安全高效生产的关键。辛置矿310轨道巷为软岩巷道,巷道变形严重,翻修次数多,严重影响巷道正常使用。论文以辛置矿310轨道巷为工程实例进行研究,运用理论分析、现场监测等方法,分析了 310软岩轨道巷变形破坏机理与失稳因素。310轨道巷为大松动圈软岩巷道,提出锚、网、索、喷联合支护方案与锚注支护方案,运用理论计算法与工程类比法确定支护参数,建立FLA
目前,惯性约束聚变(Inertial Confinement Fusion,ICF)是颇受人们关注的一种受控核聚变。在惯性约束聚变的实验中,将玻璃微球靶丸作为燃料载体。使得靶丸中的聚变燃料气体发生