跨模态哈希学习算法及其应用研究

来源 :江南大学 | 被引量 : 1次 | 上传用户：tom_7758

【摘要】

：

随着网络信息技术的发展,全球已经迈入了多媒体大数据时代。数据信息通常关联图像、文本、视频、音频等多种模态形式,多种模态数据分别以不同的展现形式刻画同一事物,表达相

【作者】

：

庾骏

【出处】

：

江南大学

【发表日期】

：

2020年01期

【关键词】

：

跨模态学习哈希学习图嵌入线上哈希学习半配对哈希

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着网络信息技术的发展,全球已经迈入了多媒体大数据时代。数据信息通常关联图像、文本、视频、音频等多种模态形式,多种模态数据分别以不同的展现形式刻画同一事物,表达相同的语义信息。跨模态数据间丰富的互补信息蕴藏着较大的经济价值,给社会发展带来契机。由于跨模态数据处在异构高维空间,且不同模态之间存在相关性,因此有效地学习跨模态数据潜在的低维共享空间对提升信息搜索精度非常重要。本文以跨模态数据为研究对象,结合哈希技术,设计有关跨模态哈希方法并研究其在跨模态检索、图像检索、文本检索和多媒体检索中的应用。本文主要研究内容概括如下:一、提出了基于矩阵分解的跨模态监督哈希模型。为了提升模型的判别性,我们利用已知的标签信息去学习类别属性信息,使得学习到的哈希特征保留了类别的属性信息。采用非线性的核映射保持了各模态内部样本间的相似性结构,有利于捕捉样本的非线性结构信息。提出的模型联合执行了分类器学习、子空间学习和标签一致性矩阵分解去学习判别性的统一哈希特征。二、提出了基于多种视图特征的跨模态监督哈希模型。鉴于单个视图的特征表示能力有限,信息捕捉不充分导致下游任务可利用的判别性信息不足,从而造成模型性能的提升受到限制。为了更好地学习紧凑的哈希编码,提出了多视图离散哈希模型,利用多种视图特征去表征跨模态数据,丰富了特征描述信息。在多种搜索任务上的大量实验结果表明多视图特征能大幅度提升检索性能。三、提出了基于Hadamard矩阵的跨模态融合哈希模型。传统的跨模态融合哈希为了提升模型的性能引入了较多的超参数,选择最佳超参数是比较费时费力的。为了解决这个问题我们基于Hadamard矩阵设计了一种新的线上跨模态融合哈希方法,该方法简单有效,涉及很少的超参数,并在哈希学习中保持了较好的判别性。在线上搜索过程中以自适应方式捕捉跨模态数据的动态变化信息。实验结果表明该方法在多媒体检索应用中具有较高的准确性和效率。由于该方法对超参不是特别敏感,因此能够被非常灵活的应用。四、提出了基于标签传播的跨模态半配对哈希模型。大多数现有的跨模态方法假定跨模态数据是完全对齐成对的,然而在现实中完全对齐的数据并不普遍,同时考虑有限的类别标记数据,提出了一种半配对半监督的哈希模型。该方法基于锚点样本构造跨模态相似度图用于标签传播,为未标记类别的数据生成伪标签,结合了特征学习和分类器学习来学习哈希。在半配对半监督和全配对半监督设置下的实验结果验证了该方法在跨模态检索任务中的有效性。五、提出了基于多模态图嵌入的跨模态无监督哈希模型。目前大部分无监督的跨模态哈希在学习哈希过程中没有同时考虑特征学习和跨模态数据的几何结构保持机制。提出的方法利用l2,1范数约束项学习紧凑哈希特征,视觉空间中的局部线性邻域结构和文本空间的语义关联直接被保持在哈希编码中。在标准数据集上的实验结果表明联合图嵌入和特征学习的无监督哈希在性能上有明显的提升。综上所述,本文在多种跨模态数据场景中提出了五种跨模态哈希方法,充分利用跨模态数据之间的互补性,语义关联和几何结构特性,提升模型在跨模态搜索、图像搜索、文本搜索和多媒体搜索应用中的准确性和效率。大量的实验结果表明所提方法相比已有的相关方法具有更好的性能和优越性。

其他文献

氨基酸类添加物对玉米秸秆光合生物制氢影响的实验研究

本论文是在国家自然科学基金项目“暗光两步法生物制氢调控机理及能量梯级耦合特性研究”(项目编号:51676065)的资助下完成的。氢能作为一种清洁无污染的可再生能源逐渐受到重视。光合生物制氢技术可以将秸秆等生物质转化为氢能,将有机废弃物的利用和清洁能源的生产结合起来,同时解决了能源问题和环境问题。本文以玉米秸秆为产氢原料,对光合发酵比产氢量、产氢速率、能量转化效率,以及产氢发酵液的pH值、氧化还原电

学位

光合生物制氢光合细菌氨基酸氮源

颅颈动脉血栓形成时间的定量MRI研究

第一部分:兔颈总动脉血栓模型制作与血栓MRI定量测量方法的初步研究目的:研究兔颈总动脉血栓模型制作与血栓MRI定量测量的方法及可行性。方法:健康雄性新西兰大白兔10只,采用改良的凝血酶法建立兔右颈总动脉血栓模型。在建模后4.5～6h进行扫描,比较不同MR成像序列(3D-TOF序列、T1WI、T2WI黑血序列、T1-mapping及T2-mapping序列)图像质量及T1值、T2值测量的可重复性,并

学位

动物模型颈总动脉血栓磁共振成像T1-mappingT2-mapping

基于改进神经网络的风电场超短期风速预测研究

能源转型的趋势不可阻挡,风能在能源转型过程中占据领先的地位。风速预测精度的提高必然能加快风能的发展。更加精确地预测风速成为了众多研究者的目标,关于风速预测的研究方

学位

风速预测改进神经网络数据预处理聚类软件设计

两种尺度低涡背景下MCS中β尺度强对流带的成因分析

本文利用WRF中尺度数值模式,NCEP/NCAR再分析资料、多普勒雷达观测资料等,对2015年8月3日发生在山东地区附近的一次两种尺度低涡影响下的MCS过程进行数值模拟、潜热敏感性试验和对比分析,研究了此次过程中中尺度低涡发生发展的原因和两种尺度低涡背景下MCS中β尺度强对流带的演变成因及涡度结构。结果表明:(1)在天气尺度的东北冷涡槽前,高层高空急流入口区右侧存在强辐散场,低层有不稳定能量释放为

学位

中β尺度强对流带东北冷涡中尺度低涡涡度收支潜热

地域性园林视角下的成都市芙蓉植景更新与发展研究

木芙蓉是中国传统名花,由于其花开深秋"拒霜"、花名寓意"福荣",雅俗共赏,自古以来深受国人喜爱。文章首先从生命、文化、美学、空间等方面总结木芙蓉的基本特征,基于历史文献

会议

地域性园林木芙蓉植物景观更新

学科核心素养背景下课堂“问题链”的设置策略

问题链是历史课堂教学的重要手段,对于高效课堂的构建具有十分重要意义。为了更好地适应学科核心素养的要求,课堂问题链的设置要具有强烈的目标意识,搭建层次分明而具有足够

会议

历史核心素养问题链高效课堂

基于偏好度的P2P网贷投资混合多属性决策研究

P2P网贷平台经历了问题平台集中暴发时期后,目前已进入合规检查并整改备案时期,增加了投资者在网贷平台进行投资理财的信心。加之现在越来越多的网贷平台广告充斥着人们的眼球,吸引了众多投资者跃跃欲试。然而,P2P网贷平台的投资者必然面临着投资项目的选择问题。虽然现在大多P2P网贷平台会先对借款者进行审核,再将审核通过的网贷项目在平台进行发布,但借款人违约的情况仍无法完全避免。因此,如何指导投资者识别出信

学位

P2P网贷投资决策混合多属性决策偏好度基于偏好度的P2P网贷投资混合多属性决策模型

基于任务包的船厂作业进度管控系统研究

生产作业进度管控是船厂生产管理的核心。随着“两化融合”等国家性战略的推进,船舶制造企业运用信息化手段进行船厂作业进度管理已成为提高企业生产管理水平的必经之路。在保证船舶作业的成本和质量的前提下,结合信息化手段对船厂作业进度进行有效的管理变得的十分重要。为了提高船厂作业进度管理水平,本文将网络计划技术和挣值法集成应用于船厂作业进度管控。主要的研究内容和成果如下:(1)船厂作业进度管理的相关概念剖析。

学位

进度管控网络计划技术任务包多级挣值法进度管控系统

基于深度相机的室内定位系统研究

同时定位与建图(SLAM)是机器人进行自主运动的关键技术,具有广泛的应用前景。随着机器人技术的飞速发展,如何获得更为精确的机器人位姿显得尤为重要。由于深度相机能够获取更

学位

视觉定位系统深度相机点特征线特征多特征融合图优化

多变量时间序列的稀疏连通网络提取及应用

多变量时间序列通常来自于对现实世界中的动态系统的监测,其中每个维度代表通过一个(虚拟)传感器测量出的局部特征。考虑到一组动态系统的相似性与差异性,并同时对它们进行准

学位

机器学习动态系统稀疏网络共享正则矩阵重排序

跨模态哈希学习算法及其应用研究

其他学术论文