深度学习在视觉数据分类中的应用研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:gr123abc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工神经网络与认知科学的迅速发展,深层神经网络和视觉数据的研究也日益加深。深度神经网络起初的兴起也是源于大脑的视觉加工模式;我们的大脑通过多层神经元将信息逐层提取为更抽象的信息从而建立相应模型。视觉数据被人们认为是视觉信息加工研究中的重要信息;视觉数据的识别方法主要采用人工特征和机器学习结合的识别方法,如基于浅层神经网络和支持向量机的特征识别等。在这种方法中,主要依靠先验知识,人工设计特征,机器学习方法只负责特征的分类或者识别,因此特征设计的好坏直接影响到整个系统的性能。基于深度学习在学习特征表征方面的优势,本文对深度学习方法在视觉数据分类中的应用展开了研究。  本文整理了国内外关于视觉行为的研究,图像识别研究和深度学习相关研究背景,本文开展了深度学习方法在视觉数据分类中的应用研究。主要贡献包括:  1)我们构造了两层去噪自编码器和一层逻辑回归的多层神经网络用在视觉搜索和视觉浏览两种眼动数据的分类中;去噪自编码器用于无监督特征提取,逻辑回归用于有监督学习输出类别信息,并且和浅层模型比如支持向量机和逻辑回归进行对比;我们进一步应用adaboost迭代算法对不同的模型进行加权平均,进一步改善了深层网络在测试集上的分类性能。  2)我们介绍了深度神经网络的几种正则化方法。随机dropout方法通过随机去除隐含层单元的作用有效的减少了深度神经网络的过拟合,然而这种方法是随机的对待每个单元,会引起输出信息的丢失。我们基于局部权值共享理论提出一种改进dropout方法,该方法是在局部范围内屏蔽隐含层节点的作用,从而有效的减少了信息的损失。  3)我们将dropconnect网络应用在全连接层的输入,stochastic pooling应用在子采样层,maxout网络和我们提出的dropout方法应用在全连接层的输出。将我们提出的整体的改进方案应用在手写字符数据集、人体姿态数据集和场景图像数据集上;在迭代次数较少的情况下,我们提出的改进方案在测试集上的分类误差较小,提高了在测试集上的泛化性,也就是提高了测试集的分类正确率。
其他文献
该论文研究了Linux文件系统的结构、常用数据结构和实现方法,以及它在操作系统中的接口和优化原理.论文的主要研究内容包括:(1)介绍了Linux操作系统的发展过程、特性和不足,
图像匹配技术在许多领域内有着广泛而实际的应用.该文主要研究灰度图像匹配算法,分析研究现有的各种图像匹配算法,在图像特征提取,匹配基元选取,搜索策略等方面进行了实验研
在关节中加入柔性是未来机械臂发展的大势所趋。特别是大柔性关节机械臂更是具有无可比拟的优势,其特点是安全性强,可以通过关节变形精确测力,力控制平稳精确,抗冲击能力强,具有储
本文研究了使用功率MOSFET的固态高频感应加热电源。在分析对比并联和串联逆变器的基础上选择了串联逆变方案。在分析对比各种调功方式的基础上选择了不控整流加斩波器的调功方案。分析对比了各种常用电力电子器件选择了功率MOSFET作为逆变器开关元件。本文详细计算了电源各部分的参数,设计了高频变压器。本文设计了逆变控制电路、功率MOSFET的驱动电路和保护电路,保证了最小的开关损耗和最高的效率。本文还给出
该文研究的课题是系统工程理论与应用的重要分支之一--离散系统优化及其求解与应用.该文主要吸收了蚂蚁算法这种源于生物世界的新的仿生类算法思想,对一系列不同的离散系统优
该文综述了汽车电子技术的发展,讨论了目前使用较多的汽车电子控制喷油装置,就汽油发动机电子控制中空气流量测量的基本原理,剖析了目前空气流量计的技术,结合课题的背景提出
处理线笥定常的鲁棒稳定和鲁棒性能问题,已经有较成熟的基于LMI的技术和方法.但是对非线性系统,无限维系统(如迟滞系统),以及执行机构非线性系统(如饱和受限系统),上前还不存
该文的主要成果表现在以下三个方面:第一,对非平衡级模型进行了改进.在非平衡级模型汽液平衡计算中首次应用复频域方法,使得非平衡级模型可大范围收敛于各种精馏过程,显著提
该文主要研究关系数据库系统在Web环境下的应用,Web技术的迅速发展和广泛应用,给传统的关系数据库应用技术带来了新的发展契机,同时也对它提出了新的挑战.如何将传统的关系数
两相流参数测量在工业生产和科学研究中有重要意义,层析成象是最好的流型识别及横截面分布信息测量的方法之一.从国内外研究资料反映的研究现状来看,电容层析成象系统是研究