基于哈希算法和生成对抗网络的图像检索研究

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户:ycdyjlc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能时代不断进步,使得计算机在很多方面能够做到和人类一样思维的操作,大幅度提升了办事的效率,正因为科技的进步,图像检索方式也在不断进步,人们对于图像检索的需求也日渐增多,因此,如何在大规模的图像检索任务中提升速度和精度成为图像检索工程中非常关键的任务。针对如何提升大规模图像检索任务的精度和效率的问题,提出了一种结合哈希算法和生成对抗网络算法的图像检索模型。该模型在无监督条件下进行,即不利用图像标签信息解决相似向量分类的问题,做到检索精度准确且检索速率高效。首先,利用卷积神经网络提取图像特征,将图像更深层次的特征有效提取出来,将图像更复杂的内容准确表达。其次,将得到的特征向量经过哈希函数量化处理,得到二进制哈希码,同时,为了能够正确将无标签图像分类,使相似图像的哈希码更相似,将根据分类算法构造近邻结构辅助哈希算法生成二进制哈希码。接着,利用生成对抗网络优化所得二进制哈希码,将二进制噪声变量作为生成器的输入,使得判别器对生成的假样本或真实所得的二进制样本进行判断,生成器和判别器通过不断博弈,将准确的哈希码输出。最后利用汉明距离对图像的特征向量进行相似性匹配,最终完成图像检索任务。实验证明,该实验适合于较大规模图像检索任务,并在标准图像数据集MNIST手写图像数据集和CIFAR-10图像数据集上进行实验验证,同经典无监督哈希算法进行图像检索的实验结果进行对比,实验结果显示,相比于对比的检索模型,该模型大幅度提升了检索精度。该论文有图32幅,表5个,参考文献55篇。
其他文献
二十一世纪以来,计算机技术逐渐被人们应用到生活和工作中。将办公系统与计算机技术结合,从而提高办公系统效率。工作流技术即工作流程在计算机应用环境下自动化并按照一定的
随着科学技术和经济全球化的飞速发展,各国公司和专利发明者对知识产权的重视程度越来越高,每年有大量的专利申请者申请国际专利,因而催生了大量的专利翻译公司。笔者曾于2018年10月至2019年3月在河北领英翻译服务有限公司实习,实习过程中得到了大量宝贵的翻译材料。本次翻译实践材料来源于公司的专利摘要,主要涉及医药、食品、化学、运输、电信、建筑类等领域,材料涉及专业词汇较多,笔者需要查询、掌握一定量的专
洪浩尔舒特凹陷是二连盆地富油老凹陷之一,但凹陷油气资源勘探潜力巨大。针对该凹陷烃源灶定量表征不精细和灶藏关系不明确的问题,本文将从烃源灶评价、烃源岩热演化历史、灶
北二东区储层岩石是一套白垩纪陆相湖盆沉积的碎屑岩,岩石成分以长石—石英砂为主,岩石以细砂为主,油层压实程度差,油层较厚,属于高孔、高渗、中高黏度油藏。研究区目前已进
墓地殡葬习俗在我国由来已久,“入土为安”的传统观念有着很深的社会伦理根基,但由于我国人口基数庞大及随着现阶段人口老龄化速度的加快、国家城市化建设的不断推进,使得近
图像显著性检测是利用计算机模拟人类的注意机制从图像中提取出感兴趣的区域,用于后续的图像处理,该技术广泛应用于目标识别、图像检索、图像分割、基于内容感知的图像压缩等
在图像分割过程中,通常一幅图像会被分成前景(目标区域)和背景(非目标区域)两部分,对图像分割所得的目标区域进行特征提取和分析有助于我们对图像所表示的物体的本质有更好地认识并提供相应的行为方案.本文针对传统的总变分(Total Variation,TV)图像前后景分割模型在分割过程中易产生阶梯效应和丢失图像细节信息而导致分割得到的图像质量下降的问题,提出了总广义变分(Total Generalize
无意识思维是指当个体的注意指向其它无关对象时所发生的与任务或目标相关的认知或情感思维过程。研究发现,与有意识思维相比,无意识思维在创造性问题解决、说服、道德判断、人才选拔、决策等方面均存在优势效应。但是,最近研究表明,分心任务与实验任务的相似性会影响无意识思维效应。具体来说,当分心任务与实验任务相似时会阻碍无意识思维的加工,而分心任务与实验任务不相似时则有利于无意识思维的加工。但是,由于该研究的实
近年来,因脊髓损伤和中风等疾病导致肢体运动功能障碍的患者日益增多,运动康复治疗对其运动功能的恢复十分重要。康复机器人可以高精度辅助患者进行康复运动,但是对于大部分失去运动能力的人,一般只能实现被动的辅助动作,对于患者提高肌肉活性程度有限。功能性电刺激技术主要利用低频弱电流脉冲刺激瘫痪患者的肌肉使其收缩,以替代或矫正肢体已丧失的功能。然而由于人体肌肉骨骼系统是一个高度非线性的时变系统,加之肌肉疲劳等
图像分类主要根据图像的特征属性对图像进行自动分类.受光照、尺度变化等因素的影响,如何提取图像特征并对图像进行有效表示成为图像分类的主要研究问题.稀疏编码是一种高效的特征表示方法,它通过寻找一组超完备字典基向量,求得特征基于字典基的重建系数,在图像分类上取得了较好的性能.然而,稀疏编码的研究仍存在不足之处,比如忽略了字典基之间的群效应,欧氏距离不能很好地度量特征向量与字典基之间的距离,以及Lapla