基于卷积神经网络的图像检索算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:huayong_
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代,随着数据的迅速增加和计算能力的不断增强,深度学习成为近年来的研究热点,尤其是其中的卷积神经网络(Convolutional Neural Networks,CNN)模型已经在诸如图像、语音等很多领域取得了令人印象深刻的成果。随着拍照设备的大规模普及以及互联网的发展,网络上的图片急剧增加,如何在海量图片中做快速有效的图像检索成为人们的迫切需求。基于深度学习的哈希算法是图像检索算法中较为快速有效的算法,以其既能基于CNN自动多层次地提取图像特征,又能利用哈希将高维特征映射为简短的二进制哈希码便于存储和检索而引起研究者的广泛关注。目前关于这方面的研究中,CNNBH算法提出可以在传统的用于分类的卷积神经网络中选取一层作为哈希层,通过训练网络的分类能力来训练哈希层,然后将哈希层的输出量化便可实现端对端的哈希码生成,并基于哈希码做图像检索,其检索性能已经达到了领域内的领先水平。但是,该算法在网络结构及卷积核初始值的选取上存在一些问题,所以其检索性能还有一定的提升空间。  针对CNNBH算法中的这两点问题,本文提出了基于改进的CNNBH及卷积自编码器(Convolutional Auto-Encoder,CAE)预训练的图像检索算法,有效地提高了原始CNNBH算法的检索性能,本文的主要工作包括以下三个方面:  (1)本文提出了从哈希层的选取和卷积核的数量及比例方面改进CNNBH算法的网络结构。首先,详细研究了传统的用于分类的CNN的网络结构以及CNNBH算法提出的网络结构,然后提出了选取分类器的前一个全连接隐藏层作为哈希层代替CNNBH算法中选择第一个全连接隐藏层作为哈希层,提出了卷积层从底层到高层的卷积核采用逐层增加的结构代替CNNBH算法中每层卷积核数量相等的结构。最后,实验验证了本文改进的CNNBH网络在获得的分类性能优于CNNBH算法。  (2)本文提出了使用一种无监督学习算法,即卷积自编码器,对改进的CNNBH网络的卷积核做逐层预训练初始化,再通过有监督学习来继续训练整个网络。首先,分析了Xavier算法初始化是人为选择一些初始值来得到随机数并没有充分考虑输入数据的内在特征这样的弊端,然后研究了两种无监督预训练算法,自编码器和限制玻尔兹曼机,总结了通过无监督预训练可以使网络获得图像自身的抽象特征,并且为网络提供较好的初始权值。但是这些无监督学习算法的网络参数众多,适合对全连接网络做预训练,不适合卷积神经网络。接下来,我们提出使用一种卷积自编码器来对改进网络的卷积核做逐层预训练,再使用标签数据做有监督微调。最后,用实验验证了本文的基于CAE预训练的卷积神经网络在分类能力上的优于基于Xavier初始化的卷积神经网络。  (3)提出了基于改进的CNNBH网络及CAE预训练的图像检索算法,给出具体的算法步骤,设计实验验证了其在图像检索上的有效性。实验结果展示,本文的图像检索算法,只需在MNIST数据集的1千个数据的子集上做有监督训练,就可以达到很可观的检索性能,其性能可以匹敌原始CNNBH算法在MNIST数据集的5万个数据的训练集上有监督训练后达到的检索性能。  综上,本文提出了一种基于改进的CNNBH网络和卷积自编码器预训练的图像检索算法。实验结果表明,本文算法中提出的网络结构的改进方法和卷积自编码器预训练的卷积核初始化方法都有效地提高了算法的检索性能,对基于深度学习的图像检索研究具有重要的意义。
其他文献
储物柜的应用给人们的生活带来了极大的便利,应用前景广阔。但是,传统的电子储物柜功能相对简单、用户管理不便,其安全性和美观性都有待提高。这些不足限制了其在银行、机场等高
在火电机组中,复杂的工质形态通过各种设备和管道组成了复杂的流体网络。流网模型的建立对于火电机组仿真系统的建立与完善十分重要。对火电机组中多样化的工质形态所组成的复杂流体网络进行分析建模,针对流体网络的压缩特性,将实验建模与机理建模相结合,应用了两种方法对不同流体进行建模。针对不可压缩流体,应用信号流图理论,从宏观角度建立流体网络模型,通过分析系统中不同节点压力和流量等物理量之间的机理关系,重点建立
柴油机是一种常见的动力设备,它工作是否正常直接关系到整个设备的运行状态,对其进行状态监测和故障诊断识别具有重大的意义,可以避免不必要的损失。一般柴油机的工作环境恶劣,采
时滞现象经常出现在实际系统中,例如通讯系统、化工过程、核反应堆、电力系统以及经济系统等。时滞不仅影响系统的稳定性,而且会影响系统动态性能。当前对时滞系统进行分析得到
煤矿矸石山自燃现象普遍存在,对环境污染及危害极大,防治煤矸石山自燃是矿区环境修复的重点研究内容。煤矸石山的自燃过程是一个相当复杂的物理化学反应的过程,它从刚开始时的常
证据理论有综合处理不确定性信息的能力,因此使用证据理论可以有效降低融合决策中的不确定性。它提供的融合框架,首先是将关于被测对象的多源不确定性信息转化为相应的证据,然后
摇摆试验台在国防测试领域起着重要的关键的作用。三自由度摇摆台是模拟船舶横摇、纵摇和垂荡运动的实验测试设备,它为导航设备的研制提供运动模拟和精度测试提供条件,所以开
随着自动控制技术的不断革新,控制系统的复杂度日益提高,传统的控制系统设计流程日益呈现出它的弊端:研发周期长、难度大,调试和维护困难,设计效率低、可重构重组性低,针对这样的问
分数阶混沌系统作为非线性系统的一种特有运动形式,在实际生活中有着广泛的应用,特别是由于其表现出的内随机及对初值敏感等特性,非常适合应用在保密通信领域中。分数阶混沌系统
在光刻机研制中,双工件台的换台方案是必不可少的设计环节。双工件台系统在换台过程中,需要多个执行器相互配合才能使换台动作顺利完成。而且在运行过程中,对电机的定位精度