基于深度学习的检索技术研究

来源 :中国科学院大学(中国科学院西安光学精密机械研究所) | 被引量 : 1次 | 上传用户:ryanme
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多媒体检索技术研究的是如何快速和准确地找到有效的数据,该技术已经深入到了许许多多的领域,并为人们的生活生产提供了极大的便利。因此,如何快速和准确地检索信息,使之有效地应用于公共安全、电子商务、医学诊断、版权维护等方面,已经成为多媒体检索技术研究的重要问题。由于多媒体检索技术的重要应用价值,目前已成为计算机视觉和模式识别领域的研究热点。近年来,由于深度学习可以更好的获取信息和提高检索的效率,因而它更适合于大规模多媒体数据的检索。虽然基于深度学习的多媒体检索技术均取得较好的发展,但是仍然存在以下问题:1)图像检索算法中深度特征信息不够丰富;2)没有充分利用深度特征的相似关系;3)没有考虑哈希码的排序信息;4)忽略图像和声音的相对语义相似关系和多尺度上下文信息。针对上述问题,本文主要从四个方面开展了基于深度学习的检索技术的研究,主要的研究内容和贡献点如下:(1)基于组内相关性增强的孪生膨胀哈希网络的检索算法。由于深度特征信息不够丰富而无法充分利用哈希码的组内相关性,这会造成相似哈希码的相关性降低。本论文从特征的角度出发,利用提出来的初始扩张卷积结构和类别信息去学习特征的多尺度上下文信息,从而利用丰富的特征信息使得哈希码的相关性增强。(2)基于语义相似学习的类别级正则哈希检索算法。由于没有充分利用深度特征来学习语义相似关系,从而导致哈希码之间的相似性降低问题。本论文利用深度特征相似性学习去提高哈希码的相似性,使得在学习深度特征表达的过程中融入数据的相似性,从而使学到的哈希码更具有相似性和判别性。(3)基于语义排序的离散深度哈希的检索算法。哈希码排序信息对哈希技术是至关重要的,然而存在哈希码排序信息利用不够充分的问题,本文提出了通过将哈希码的离散化过程和哈希码排序信息集成到一个整体框架中,从而得到具有明显判别信息的离散哈希码。(4)基于四元组深度哈希的跨模态图像声音检索算法。针对忽略了图像和声音的相对语义相似关系和多尺度上下文信息导致检索性能较差的问题。该算法利用图像和声音的相对语义相似关系和多尺度上下文信息去提高图像和声音的语义关联性,使跨模态检索性能提升。
其他文献
随着煤矿开采深度逐渐增加,地质构造条件也日趋复杂,冲击地压和煤与瓦斯突出等动力灾害频繁发生且日趋严重。地质构造对动力灾害的发生有着明显的促进作用,甚至起主要作用。
目的:心房颤动是临床上最常见的心律失常之一,其发病机制复杂,具有高患病率和复发率,严重威胁人类健康。近年来,随着生物测序技术及生物信息学的发展,非编码RNA在心血管疾病
目的:1.采用牺牲模板的微通道致孔方法制备具有定向交叉微通道纤维环及多孔髓核结构的丝素蛋白一体化支架;2.体外检测该仿生微通道丝素蛋白一体化椎间盘支架的生物相容性并观
智能交通系统(Intelligent Transportation System,ITS),是将先进的信息技术、传感器技术、电子控制技术、系统工程及人工智能技术等有效地综合运用、集成到交通管理中,从而
全程自养脱氮(CANON)系统以其高效、经济、节能等特点在废水处理领域展现出广阔的应用前景。制药废水作为一类高氨氮工业废水,氮素的污染治理刻不容缓。然而,这类废水中残留的
高校思想政治理论课是我国高校统一开设的一套用以进行主流意识形态思想与理论教育的课程体系,由专科生、本科生、硕士研究生和博士研究生的思想政治理论课的必修课和选修课
集成激光雷达、组合导航、相机等多种传感器的移动测量系统广泛应用于测绘、智能驾驶等多种行业当中。传感器的多元化很大程度上推动了移动测量技术的快速发展,但也为移动测
再生混凝土可实现废弃混凝土的循环利用,减少砂、石等自然资源开采与建筑垃圾填埋,解决了部分环保问题,对实现建筑资源的可持续发展具有重要意义。再生混凝土具有较广阔的工
卷积神经网络(Convolutional Neural Network,CNN)是人工神经网络的一个重要分支,是近几年随着深度学习概念的提出,才开始广受关注的一种机器学习方法,是一种以卷积运算为核
相比干喷和潮喷,混凝土湿喷技术具有低粉尘、高强度等优点,但是传统混凝土湿喷机的工作原理决定了其存在喷射脉冲的问题。混凝土喷射脉冲导致了喷射过程回弹率高、工人劳动强