基于深度学习的哈希图像检索方法研究

来源 :江西理工大学 | 被引量 : 0次 | 上传用户:reemchan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于网络的蓬勃发展,图像数据资源呈爆发式增长,面对海量的数据资源,传统的图像检索方法检索效率慢且检索性能低,已经无法满足应用要求,所以如何在大规模图像数据资源中高效、快捷、精确地检索用户需要的图像已成为热门话题。近年来,深度学习技术蓬勃发展,为图像检索技术的进步提供了强大的助力。目前,深度学习与哈希算法的结合已成为现代图像检索算法的新潮流:一方面哈希算法是图像检索中最普遍最常用的近似最近邻搜索技术之一,在计算效率和检索质量方面行之有效;另一方面深度学习利用端到端学习图像深层特征,生成有效的二进制哈希码。损失函数和网络结构的设计密切影响了深度学习与哈希算法的特性,因此本文根据网络模型与哈希算法的优势,提出了基于深度学习的哈希图像检索方法。本文的工作主要包括:(1)针对已有的成对损失和三元组损失的深度哈希框架往往收敛缓慢,在每次更新时只对一个负样本进行优化,从而既增加了计算量,也导致了训练速度和收敛速度缓慢的问题。针对上述问题,提出了一个采用多类N-pair损失的深度哈希图像检索方法。首先在训练时会同时学习所有类组合之间的距离,从而增大样本与其所有负类样本间的距离并缩小与正样本间的距离。其次,通过使用N对的有效批处理构造策略来减少模型训练的计算负担。该方法在两个公开的基准图像数据集上与9种成对损失和三元组损的图像检索方法开展了实验,与对比方法进行了深入分析。实验结果显示,所提方法在图像检索中达到了更高水平的检索性能。(2)针对现有的哈希图像检索方法表达能力较弱,训练速度慢,检索精度低,难以适应大规模图像检索的问题,提出了一种基于深度残差网络的迭代量化哈希图像检索方法。首先,使用深度残差网络对图像数据进行多次非线性变换,提取图像数据特征,获得具有语义特征的高维特征向量;然后,使用主成分分析进行特征降维,运用迭代量化对生成的特征向量进行二值化处理,更新旋转矩阵,得到最佳的投影矩阵;最后,通过实现哈希学习,获取到最优的二进制哈希码,在汉明空间中实现图像检索。该方法在三个基准数据集上与先进的哈希图像检索方法开展了实验,结果表明在大规模图像检索场景下,所提方法减少了量化误差带来的影响,提高了训练速度,具有更高的检索性能。(3)为了更高效的将学习特征表达并抑制在离散过程中产生的量化偏差,提出了基于深度残差注意力网络的深度哈希图像检索方法。注意力模块学习了强调或抑制的内容和位置,并有效地改进了中间特征,提升网络捕获有效图像信息的能力,从而提高特征学习的能力。此外,还设计了成对度量三元组损失函数,在三元组损失函数中通过结合欧式距离和余弦距离度量,引入角度度量来缓解单个度量的偏差,学习全局特征来改善度量学习损失,有助于模型扩大样本的相似性特征。在两个基准数据集上与先进的深度哈希图像检索方法进开展了实验,结果显示所提方法能够有效的增强局部目标特征,有助于扩大样本间的相似性特征,从而提高模型的性能。
其他文献
随着云服务、大数据、物联网、无人驾驶等新型数据业务进入人们的生活,互联网数据流量正经历着爆炸式增长。然而互联网的基石——光纤通信系统与网络的传输容量在历经了多次技术革新与突破后,已增长乏力,正在逼近理论上的非线性香农极限。轨道角动量(Orbital angular momentum,OAM)是电磁波(光波)除振幅、相位、频率、偏振(自旋角动量)、时间之外仅剩还未开发的维度资源,受到了广泛的关注。基
学位
<正>城市更新项目投融资模式设计,需要结合具体地方的综合财力、资源禀赋,以及具体项目的经营属性、商业模式、回报机制、潜在风险等综合考量,从投资主体、融资模式、平衡机制等多维度统筹谋划城市更新项目一般投资额较大,在实施过程中,将不可避免遇到资金从何而来的问题。要解决资金问题,就要解决投融资模式问题。住建部在《关于印发实施城市更新行动可复制经验做法清单(第一批)的通知》中,也专门就“构建多元化资金保障
期刊
肺炎是导致儿童死亡的严重疾病之一,且当前新型冠状病毒肺炎在全世界广泛流行,因此对肺炎的快速检测研究具有重要意义。肺炎检测不仅要求具有较高的检测精度,还需要有较好的实时性。由于医学图像中肺炎的特征不够明显,放射科医生在诊断胸部X光片中是否存在肺炎需要花费大量的时间。长时间观看胸部X光片,医生的视觉容易产生疲劳,有可能对胸部X光片中的肺炎产生漏诊和误诊的情况。随着人工智能的发展,利用深度学习的方法实现
学位
受制于成像设备的材质及大小,当拍摄场景下的动态范围超出成像设备所能捕获的范围时,无论选择何种曝光模式,高亮区域信息或低暗区域信息在一定程度上会丢失,造成非正常曝光问题,导致图像初始细节信息损失,非正常曝光现象已成为制约图像质量的一个重要原因。图像增强技术旨在平衡非正常曝光图像的整体亮度,恢复局部区域中丢失的信息,突出图像全局纹理细节信息,来达到改善图像质量的目的。虽然已有许多学者将曝光补偿技术集成
学位
激光干涉引力波天文台(LIGO)在2015年探测首次发现黑洞并合发出的引力波信号,开创了引力波天文学时代。引力波及其电磁对应体的发现对人类对于宇宙的观察和理解而言有着紧要的意义。引力波暴高能电磁对应体全天监测器GECAM卫星旨在完成对引力波事件的高能电磁对应体的全时段监视观测,并监测全天的高速射电暴的高能辐射、特殊伽马暴以及磁星暴发等高能天体暴发事例,为有关的物理研讨提供能谱、光变及定位等观测数据
学位
圆极化天线可以抑制多径干扰并减少极化失配,在各种无线系统中已经有广泛的应用。而宽波束圆极化天线具有更大的角度覆盖范围,可以增强使用这种天线的通信系统的可靠性。此外,多频天线可以用于全双工通信以降低网络延迟,同时还能降低同一个通信系统内天线之间的干扰。本文基于基片集成波导结构,对这两种天线进行了研究与分析,主要工作概括如下:1、基于基片集成波导结构设计了一个宽波束圆极化天线。首先,本文先分析了实现宽
学位
双伸缩立柱是矿用液压支架的重要组成部分,详细阐述了煤矿用液压支架双伸缩立柱维修的拆装工具。在双伸缩立柱的拆解和装配作业中利用创新设计的液压固定式双伸缩立柱拆装机取代了传统的机械固定式拆装机,优化了作业工艺,减少了操作工序,降低了工人劳动强度,提升了工作效率。实际应用结果表明,液压固定式系统稳定,生产中操作流畅,创新设计的拆装机同时满足质量和安全要求。
期刊
心血管疾病的患病率和死亡率仍处于上升阶段,这不仅严重威胁着世界各国人民的健康,也极大加重了家庭和社会的经济负担。心音信号能准确地反映心脏及周边血管的生理以及病理信息,是心血管疾病临床诊断的重要依据之一。精准的心音自动分析系统,可辅助医生进行临床诊断,提高诊断的准确性,弥补经验性判决的不足;同时,也可用于群体庞大的体检筛查,减少医学检测人力和物力的成本,提高检测效率。因此,研究有效的心音分析算法,对
学位
恶性肿瘤,也称为癌症,是一种与基因突变有关的复杂疾病,普遍存在人体的各个组织中,一直以来都是全世界范围内的公共问题。科学家和临床医生长期以来积极地与癌症及其伴随疾病做斗争,但各国的癌症发病率仍逐年升高。随着医疗技术水平的不断进步,各种抗肿瘤药物相继研发,癌症患者的生存时间和状况得到了很大的改善。但晚期癌症至今仍无治有效的治愈方法,只能通过相关技术手段延长患者的生命。相比于癌症晚期患者,癌症早期患者
学位
随着互联网的普及和信息技术的快速发展,越来越多的人通过社交网络进行日常的沟通交流和信息获取,社交网络已经成为人们生活中不可或缺的一部分。信息在社交网络中的传播速度极快,社交平台上的热搜事件很可能只是在几分钟前才发生的,并且信息的扩散范围也很广,理论上可以覆盖整个网络。由于新用户的不断加入,社交网络的规模逐渐庞大,其中的内容和数据日趋丰富。基于以上特点,不少商家开始在社交网络中进行病毒式营销,以推广
学位