基于卷积神经网络的多模态哈希方法的研究与实现

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:wangyang062011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多模态检索是指在不同模态的数据中进行检索,即通过一种模态的数据检索另一种模态的数据并保证两种模态的数据有相似性。如今多模态哈希算法已经被广泛应用于大规模多模态检索的近似最近邻搜索(Approximate Nearest Neighbor,ANN)中。其中有监督的哈希算法通过利用数据对的语义相似性来提高哈希编码的质量,最近受到越来越多的关注。对于大多数现有的用于多模态检索的有监督哈希算法,数据始终依赖于人工标注的特征向量。随着机器学习的发展,通过机器学习提取特征的方法被广泛使用。与人工标注的特征向量相比,机器学习得到的特征更加全面和准确,再通过量化方法将提取到的特征量化为二进制编码。然而,传统的量化方法产生了哈希码并不是最优的,在网络结构和量化方法上都有很大的改进空间。本文针对上述问题及现存方法的一些不足,开展基于卷积神经网络的多模态哈希方法的研究。本文首先研究了卷积神经网络(Convolutional Neural Network,CNN)的体系结构及关键技术,然后对自然语言处理和哈希算法等做了全面的综述。从而为全方位地分析和研究卷积神经网络在多模态检索上的研究奠定了基础。进一步,通过分析传统的深度学习多模态检索方法,建立了优化的基于卷积神经网络的多模态检索模型。针对现有多模态方法存在的问题,对两种模态的数据分别构建两种不同的网络结构,也就是使用具有多个卷积层的图像网络来提取图像特征,使用Word2Vec的文本网络来提取文本特征。接着,提出了一种基于K-means的深度多模态哈希量化优化方法(K-means-based Quantitative-optimization for Deep Cross-modal Hashing,KQDH),通过K-means聚类算法对这些特征点进行分类,通过一种全新的量化方式来控制量化误差,减少计算量的同时,使得哈希码更好地表示出多模态特征。实验结果表明,该方法可以在多模态数据之间保持相似性并最大程度地捕获更加丰富的语义信息,更加高效准确地完成多模态检索任务。最后,本文将理论研究结果和实际相结合,设计、实现了基于卷积神经网络的多模态哈希检索原型系统。该系统采用了本文提出的深度多模态检索模型及哈希量化优化方法(KQDH)。系统分为多模态数据管理、模型管理、特征处理和多模态检索四个模块,真正实现了以文检图,以图检文。测试结果表明,该系统能很好地完成多模态检索任务。本论文的研究成果可以为卷积神经网络在多模态检索邻域的研究提供新的想法,与此同时还可以将其投入实际应用,具有优秀的理论价值和更好的应用前景。
其他文献
倒向问题是反问题中一类较为重要的问题,它在工程等领域有着很广泛的应用.因此,分数阶扩散方程的倒向问题的研究对很多领域的发展都发挥着重要的作用.本文主要讨论了球型对称
海表流场和海表风场不仅在海洋动力环境中发挥着重要作用,还与人类活动息息相关。根据近海洋流观测特点及海表风场卫星观测特点,本文发展了二维变分数据融合方法,并将发展的
电化学发光(Electrochemiluminescence,ECL)是一种由电化学方法激发而产生的化学发光,是电化学和化学发光结合的分析方法。ECL分析法无需激发光源、免受杂散光干扰,具有设备易组装以及便于操作等优势,并在实际应用中表现出较好的灵敏度和选择性。因此,基于该分析方法的检测技术在食品、医学、环境等相关领域得到了广泛应用。随着对光电领域研究的不断深入,人们合成了多种具备性能优异的纳米材
我国于上世纪90年代开始探索资产证券化业务,随着资本市场的发展,资产证券化种类不断丰富,发行规模呈指数式增长。2018年,资产证券化产品共发行2.01万亿元,年末市场存量为3.0
太阳光中的紫外-B(UV-B)辐射在植物的生长发育过程中发挥着重要的调控作用,随着人类工业化和现代化的进程,臭氧层衰减及其所伴随的地表UV-B辐射增强变得不可忽略。研究表明表
基于云平台容量大、运算快且方便价廉等技术优势,越来越多的企业和单位选择将本地数据的存储和维护外包到云平台,为了保证用户的隐私安全,在数据外包之前对数据加密是最常用
广义推断是基于广义检验变量和广义枢轴量的统计推断方法,由于其性能良好,近年来被不断的应用于各类统计推断问题当中。此文章讨论广义推断方法在几种常见分布的参数推断中的应用,这些分布包括正态分布,对数正态分布,逆高斯分布,多元正态分布,指数分布,广义逆指数分布等。本文采取的主要方法是:通过构造兴趣参数的Fiducial模型,得到它们的广义枢轴量,进而给出检验的广义p值,以及兴趣参数的广义置信区间,主要结
光电化学(PEC)技术的是:在可见光下,光敏材料中价带电子向导带移动,导带电子进而向电极或者溶液发生移动,价带产生空穴,空穴被电子供体捕获,在光电材料之间形成电化学回路,产生电信号。当光敏材料与待测物质直接或间接作用时,电信号发生变化,根据这种变化,对待测物质的含量进行分析。PEC适配体传感器具备背景信号低,灵敏度高、特异性强等优点,引起广大研究者们的关注。PEC适配体传感器已经应用在多个领域,如
昭通地区页岩气区块具有储层厚度优质,有机碳硅质含量高等优点,是我国页岩气的主力开发区。该区水平井钻井作业中的钻井液技术面临井壁失稳、水平段摩阻高、扭矩大等难题,常
随着经济的发展,传统混凝土的发展逐渐受到一定的限制。聚苯乙烯泡沫塑料(Expanded Polystyrene简称EPS)是一种具有轻质、隔热、隔音、防震、耐水性、较强的抗震性等优良特征的轻型高分子聚合物。通过对废弃EPS回收并改性后,将其作为骨料,用于制备轻质混凝土,不仅减少了资源消耗,而且减轻其对环境的污染。基于此,本文选取四种不同密度(10kg/m3、15kg/m3、20kg/m3、25kg