基于图像自编码的神经网络特征学习研究及应用

来源 :北京工业大学 | 被引量 : 7次 | 上传用户:xiuluoyanyu1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体和网络技术的发展,图像作为人们生活状态最直观的表达方式,在人们生活中扮演着越来越重要的角色。大部分图像都包含了丰富的语义信息,如何在现实生活中找到用户需求的图像是我们所面临的一个难题和挑战。出色的特征表达不仅能够表示图像的类别信息,更应能够捕捉到图像的相关语义信息。为了解决上述问题,本文对基于图像自编码的神经网络特征学习问题进行了相关研究,通过在训练神经网络过程中加入通过图像自编码得到的空间关系信息,提升神经网络的特征表达能力。本文的主要研究工作如下:首先,本文分析了国内外图像检索发展的研究现状,指出了现在图像检索领域存在的关键问题在于特征表达。与此同时,回顾了深度学习模型的发展历程。通过分析深度神经网络模型中特征表达学习的过程,寻找结合深度神经网络表达和图像检索的切入点。本文发现深度神经网络能通过学习包含更多信息的标签信息提升神经网络的特征表达能力,并将其应用在神经网络特征学习中,从而提升图像检索效果。其次,本文提出了一种基于图像自编码的神经网络学习模型。该模型通过在训练深度神经网络时对训练目标加入图像对应的隐含变量信息,提升了神经网络的表达能力。该模型通过自编码,得到训练图像所对应的隐含变量表达,将之当作神经网络的训练目标,从而帮助神经网络学习到更加出色的特征表达。接着,在上述模型基础上,本文又提出了一种基于变分贝叶斯自编码的神经网络学习模型。基于变分贝叶斯的自编码模型通过学习真实的数据本质特征,能够更准确描述样本数据的分布特征。变分贝叶斯自编码在概率图模型的框架中将数据的分布特征形式化,通过最大化对数似然函数下限,刻画了样本数据的生成特征,代替传统自编码特征,提升整体模型的描述能力。最后,本文分别在公开多标签数据集PASCAL VOC 2012 Segmentation和Microsoft COCO上进行实验分析,将本文提出神经网络训练模型得到的特征分别进行图像检索性能分析、特征非监督学习分析、特征可视化分析、特征平均稀疏度分析,实验结果表明本文提出的神经网络模型较之传统神经网络具有更优秀的特征表达能力。
其他文献
随着我国城市化进程的不断推进,作为城市道路骨干系统的城市快速路也相应地加快了建设步伐。然而,在城市快速路建设和运行过程中却仍旧存在不少问题,致使通行效率低下而未能
边界跟踪与填充是图像处理的基本问题。链码间的转换是从已知一种链码获得其他链码的便捷方法。链码是获得图像几何特征的重要手段。文档图像的倾斜校正和表格识别是字符识别
1932年,Berle和Means在其经典著作《现代公司和私有产权》中首次对公司的所有权和控制权进行了界定,此后对于公司财务的研究基础都建立在这样的一个假设之下。然而,进入上个
随着时代不断的发展,车辆早已成为了人们日常出行的交通工具。然而,车辆在带给人们便利的同时,也带来了许多困扰。在遇到紧急事故的情况下,由于人类大脑反应时间有限,处理不
本文阐释了学习型社区的定义、基本特性 ,分析了学习型社区形成的基本原因和形成的基本标志 ,提炼了我国目前学习型社区的几种主要类型 (模式 ) ,回顾了学习型社会和学习型社
二十一世纪的中国经济逐渐从产品经济转向品牌经济。打造成功的品牌,确立品牌优势已成为市场竞争决胜的最重要武器。我国作为体育大国,竞技体育已迈入世界强国之列,然而体育
生物陶瓷材料不仅具有良好的生物相容性,而且可与骨和软组织形成牢固的化学键性结合,但由于本身脆性高,抗折强度低的限制,在承重部位的应用受到了很大的限制。因此如何提高生物陶
佛教开始传入中国内地的时间迄今有11种说法,"伊存口授《浮屠经》说"与"汉明帝感梦求法说"最为流行。地处天下之中的河洛地区,曾经是佛教经典的译传中心,也是佛教祖庭的所在
本文首先阐述了我国的环境污染现状,介绍了交通运输在其建设、运营与维护过程中的环境影响和危害,包括水体污染、大气污染、固体废物污染、噪声危害和生态破坏等,以及由此引