深度学习中特征表示方法研究与应用

来源 :西南交通大学 | 被引量 : 1次 | 上传用户:kuwa_li
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着硬件计算能力的提高,深度学习在计算机视觉、语音识别、自然语言处理、卫生医疗等各个领域取得了举世瞩目的成绩。特征表示与学习是深度学习研究中最为基础也是最为核心的问题。然而,目前基于深度学习的特征表示方法存在着各种各样的问题,如缺乏泛化的误差界、深层网络训练困难、过拟合、欠拟合、梯度消失、梯度爆炸、特征提取不充分等。本文针对深度学习中的特征表示问题,分别从特征表示的鲁棒性、深层网络的训练、充分的特征表示及缺失数据下的应用等几个方面展开了研究。主要工作和研究成果如下:(1)总结了自编码器的一般规律:第一,给出了输入层重构的泛化误差下界,进而证明了所有自编码器的输入层重构误差不能小于该下界,该规律可作为输入层重构是否有效的一个判别准则;第二,证明了隐含层重构达到理想状态是输入层重构到达理想状态的一个必要条件;第三,证明了最小化雅克比矩阵的F范数存在缺陷,而隐含层重构能解决这个不足,并且其特征表示能力更鲁棒。基于以上规律,提出了一种新的无监督特征表示方法:DDAEs。该方法通过同时最小化输入层和隐含层的重构误差来学习鲁棒的特征表达。相比于研究前沿的一些方法,DDAEs具有高度的灵活性、抗噪性、准确性和鲁棒性等优点。在UCI数据、图像分类数据和基因序列数据上对DDAEs进行了评测、分析和比较,验证了其特征表示方法的有效性。(2)针对深层神经网络训练困难、梯度消失、过拟合等问题,提出了一种新的结构:跨层神经元结构。该结构利用神经元收集和提取下层网络学习到的特征,并将学习到的特征传递到更高的网络层,进而使得高层网络不仅能提取到高度抽象的特征,而且还能拥有所有底层网络的优点。分析表明该结构可以用于有效地训练更深层的卷积神经网络,其不仅能缓解深层网络的梯度消失、过拟合问题,还能加速网络的收敛速度。基于该结构,构造了一种新的深度卷积神经网络模型,跨层神经元网络模型。在标准的图像分类数据集MNIST、CIFAR-10、CIFAR-100、SVHN和STL-10上,从分类精度和训练时间上验证了跨层神经元网络的有效性。(3)针对深度卷积神经网络特征提取不充分的问题,提出了一种基于多视图的特征表示方法。该方法首先利用不同的视图学习特征表示不同方面的特性,然后融合各方面得到的信息来提取单个视图无法学习到的特征。考虑到卷积网络中的全连接层不仅会破坏数据本身的空间结构,还会加大了网络的训练难度,进而提出了一种不包含全连接层的多视图的特征表示方法。在监控视频中的行人重识别数据集上对基于多视图的特征表示方法进行评测、分析和比较,验证了该方法的有效性。相比于其他方法,基于多视图的特征表示方法在数据集i LIDS-VID、PRID-2011和MARS上取得了更好的识别效果。(4)提出了一种能根据基因的不同重要性自动地加权不同基因的局部自加权最小二乘缺失值填补算法:LAW-LSimpute。该算法首先针对每个基因在缺失值填补中的重要性进行了量化建模,然后采用拉格朗日最优化方法给出了每个基因的最优权重因子。为了加快收敛速度,引入不确定性度量的概念,设计了一种迭代的缺失值填补方法:ILAW-LSimpute。大量的实验表明,新提出的ILAW-LSimpute方法能有效地减小缺失值填补方法中的估计误差。另一方面,为了验证前面提出的DDAEs特征表示方法的鲁棒性,同时也为了说明新的缺失值填补方法对后续分类等任务的有效性,对比了不同分类方法采用不同缺失值填补方法的分类结果,并给出了各种缺失率下不同缺失值填补方法与不同分类方法分类精度之间的关系。在基因表达数据集上,验证了新提出的缺失值填补算法ILAW-LSimpute对后续分类任务的有效性,并进一步验证了特征表示方法DDAEs的鲁棒性。
其他文献
铁路隧道向“更高密度、更长隧道、更大断面”发展,导致工程建设风险更大,对隧道建设管理提出了更高要求。相比其它非地下工程,隧道安全事故、质量事故、工期延误、成本失控
伴随全球信息的发展,企业间的竞争越来越表现为员工素质的竞争和员工学习能力的竞争。传统企业模式使企业无法在信息技术迅猛发展的今天立足,迫切需要企业在各个方面创新,采
1861年辛酉政变中,以慈禧和奕訢为首的集团采取果断行动,在中央铲除了肃顺集团,全面掌握了政权。然而,咸丰末期,辅政的肃顺等人在政治上重用地方汉族官僚,所提拔的曾国藩、李
蛋白质组学是研究生物机体内在变化,以及蛋白质和相关基因功能的重要手段。我们通过这项技术可以了解病原体感染的宿主体内免疫系统调控,代谢通路调节等一些系列机体的应激变
文学作品教学应该在引导学生习得知识、帮助学生训练能力的同时,最大限度地挖掘它的的精神价值,用以培养学生高尚的道德情操和形成正确的人生观、价值观。教学实践中,应该以
以往对学术语篇的研究虽然提到过论文摘要(RA)具有推销功能,但中外语言学期刊实证类论文摘要推销型式有何异同是一个尚未涉及的问题。本文从这点出发,采用语料库和体裁分析相
现阶段在量刑操作上的弊端是显而易见的。如果对影响犯罪量刑的犯罪构成情节、法定的从重或从轻情节、酌情的从重或从轻情节进行统一考虑,再具体到用数的概念或比值来量化,这更
闪烁体在吸收高能射线或粒子后可以发出紫外或可见光,与后端的光电转换器件结合可以实现高能粒子及射线的探测。因此闪烁体被广泛地应用于医疗影像、高能物理、国土安全、地
结合第三次全国林业有害生物普查,通过实地踏查,构建了基于ArcGIS 10.2软件平台及相关技术的一种操作性强的有害生物踏查地理信息图的制作方案。本方案可以有效降低踏查人员
在整个临床试验中,受试者是试验的主角,如何发现、招募、入组和保留受试者并保证受试者如期完成试验关乎着临床试验的成败。招募理论的诠释及招募相关因素全面分析将为实现招