共同子空间学习的跨模态哈希检索研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户：wuhuizuizong

【摘要】

：

【作者】

：

李鑫勇

【机构】

：

广东工业大学

【出处】

：

广东工业大学

【发表日期】

：

2023年01期

【基金项目】

：

国家自然科学基金“基于协同的鲁棒多视图学习理论与方法研究（61972102）”；

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着网络技术的发展和智能手机的普及,大量视频、图片、文本等多模态数据应运而生。如何实现高效且精确的跨模态数据检索成为社会各界关注的焦点。大量研究表明跨模态哈希方法能够将不同模态的数据转换为同类型的哈希码,在实现跨模态数据检索的同时,还能大幅降低数据检索时所需的存储空间和时间成本。已有的大多数跨模态哈希方法将异构模态的数据特征映射到一个共同的子空间中,然后通过符号函数将实值子空间转换为离散的哈希码。然而,这类方法仍然存在一些不足之处。例如,部分方法为了提高哈希码的鉴别能力,只是通过投影的方式将标签中的类别信息嵌入哈希码中,却忽略了标签中蕴含的语义相似性和潜在语义关联;另外,有些方法利用标签构造大规模相似性矩阵,这会极大的增加优化算法的时间和空间复杂度;最后,许多跨模态哈希方法在学习哈希码的过程中独立于原始数据特征,这将导致所学的哈希码无法保持异构模态数据特征之间的关联性。基于此,本文提出相似性保持的判别跨模态哈希方法和非对称判别离散跨模态哈希方法,主要研究内容如下:（1）相似性保持的判别跨模态哈希方法。通过多标签核判别分析充分挖掘标签中的判别信息和潜在语义关联,并将其嵌入到共同子空间中,提高共同子空间的判别性。此外,利用标签计算样本之间的相似性,并在哈希码中保持,一方面可以提高哈希码的鉴别能力,另一方面可以避免使用大规模相似性矩阵,降低优化算法的时间和空间消耗;与此同时,最小化共同子空间与哈希码之间的误差,可以将共同子空间中的判别信息保留到哈希码中;最后为共同子空间引入正交和平衡约束,能够进一步提高共同子空间和哈希码的判别性。（2）非对称判别离散跨模态哈希方法在相似性保持的判别跨模态哈希方法的基础上,为共同子空间添加离散约束,降低了共同子空间与哈希码之间的误差,进一步减少了判别信息的损失。此外,通过加入潜在因子模型不仅可以直接生成离散的哈希码,而且还能在汉明空间中保留语义相似性。本文将上述两种方法分别在三个使用最广泛的数据集上进行多次实验,并与当下最新且最具代表性的跨模态哈希方法进行比较;结果表明本文所提出方法的检索精度高于其他对比方法。

其他文献

新零售企业连续并购绩效研究——以苏宁易购为例

新零售当前的发展竞争激烈,为了在短时间内获得资源,大企业多采用并购和直接入股的方式,连续并购趋势明显,苏宁易购也不例外。但是连续并购绩效多是采用普适性的方法进行研究,并未结合公司特点进行评价,因此本论文就以苏宁易购为例,结合公司连续并购动机和新零售业务来针对性进行连续并购绩效评价。基于此,本文探究苏宁易购为发展新零售连续收购天天快递、迪亚（中国）、万达百货以及家乐福中国四家公司的绩效。首先以协同效

学位

基于深度学习的文本实体关系抽取技术研究

在当前互联网蓬勃发展的时代,每天都会产生海量的文本数据。如何将这些非结构化的文本进行结构化表达,从中发掘出有价值的信息,已经成为时下自然语言处理领域的研究热点。经过广大学者的多年研究,目前较为有效的方法是构建知识图谱,而构建过程中的关键技术是实体关系抽取,其旨在从文本中识别出实体,并根据上下文语境确定实体之间的语义关系。此前基于统计学的方法,存在耗时费力且可移植性差等问题。近几年深度学习技术逐渐被

学位

基于深度学习的肾脏CT图像分割方法研究

随着医学图像处理方法不断地进步,图像处理算法对于医学工作有着必不可少的帮助作用。肾脏CT图像分析通过电子计算机断层扫描技术,对肾脏相关疾病和并发症的医疗诊断和治疗有着至关重要的临床价值。肾脏CT图像分割任务中存在一定特征复杂的问题,使肾脏以及病变区域的分割变得十分困难,严重影响算法的分割效果。近年来,无论传统图像分割算法还是深度学习分割方法都难以取得非常令人满意的表现。另一方面,因为网络结构参数量

学位

中国天楹跨境并购Urbaser绩效研究

生态环保目标和政策的出台,提升了我国环境保护的地位,并促使环保产业实现了进一步发展。过去五年,环保企业数量的增长印证着产业快速发展的趋势,但随着市场容量的增加,产业内的竞争也相伴扩大,环保企业迫切需要提升自身的竞争力。并购是提升企业竞争力的重要途径,跨境并购海外优质标的更是能帮助企业在短时间内成长为具有国际影响力的大型企业。我国环保产业起步较晚,更需要通过跨境并购获取领先的技术资源,增进企业发展速

学位

基于创业板企业创新能力的多因子选股策略研究

近年来,我国专利数量和质量持续稳定增长,专利相关数据已逐渐成为评估企业研发创新水平的关键指标之一。大部分学者在考察企业创新能力与股票收益间的关系时,偏重于以专利数量维度评估企业创新能力,而在以专利质量衡量时未能充分考虑到行业特征及专利价值。本文从专利数量和质量维度综合考量企业的创新能力,并在此基础上建立创业板市场的多因子选股模型,从而验证投资具有创新能力的企业是否可以在资本市场上获得超额收益。本文

学位

室外光照估计算法及其在移动设备上的应用研究

光照估计是计算机视觉和图形学研究领域的经典问题之一,其目标是从图像、视频等输入信息中估计出真实场景的光照信息。光照估计在计算机视觉和图形学等领域应用广泛,尤其是在增强现实领域,光照估计是极其重要的一步,它的效果可以直接影响到虚拟物体的真实感体验。传统的光照估计算法是通过专业设备的数据采集和人工测量来获取较为准确的光照信息,但其过程繁琐且过于依赖辅助设备,导致该类算法只适用于特定场景。而基于深度学习

学位

股权质押下上市公司股票回购动因及经济后果研究——以梦网科技为例

随着我国资本市场的不断发展,法律逐步放松了对股票回购的限制,许多公司开始通过集中竞价的方式在公开市场中回购股票。据数据统计,以市值管理为目的且存在控股股东股权质押的公司明显多于其他上市公司,这表明上市公司股票回购与控股股东股权质押之间关系紧密,存在股权质押的公司往往更倾向于股票回购行为。目前,大多数研究是针对国外的理论与假说进行的实证分析,以探究二者的关系,针对具体公司的股权质押下的股票回购案例研

学位

基于多模态特征记忆库的视频语音检索研究

伴随着我国数字经济的高速发展以及城乡居民生活水平的稳步提高,许多民众的日常生活越来越离不开智能设备,并随之产生了海量的多媒体数据。然而常见的搜索引擎工作方式依局限于单模态内,这导致了在多模态场景下检索信息的低效和困难。因此,实现跨模态检索不仅是人们对便捷检索信息的迫切需求,还符合新时代下互联网的发展进程。然而,当前专注在视频信息和语音信息上构建语义桥梁,以实现视频和语音的跨模态检索方法却甚为稀缺。

学位

我国商业银行流动性风险实证研究——基于流动性错配指数模型

近年来,由于金融机构流动性问题不断导致金融危机发生,监管当局越加关注流动性风险问题。在国内外学术界中,流动性风险问题一直被广泛的讨论,2008年金融危机中,流动性风险带来的代价是惨痛的,传统的流动性风险管理方式已不能适应迅速发展的金融市场。在中国,随着经济蓬勃发展、金融市场的完善、以及商业经营方向的转变,商业银行的流动性风险的成因及表现更加多样化,加大了监管当局对银行流动性风险进行管理的难度。在传

学位

加权解耦语义表达的多源领域自适应方法

随着大数据时代和互联网技术的快速发展,产生了各种不同形式的数据,而这些不同形式的数据对提高深度学习模型的泛化性能起着重要的作用,但在实际应用中,大部分的数据都是依赖人工标注,成本较高,严重限制了深度学习的推广和应用。领域自适应不仅可以打破训练数据集合测试集数据的独立同分布的假设,而且可以利用有标签的迁移源数据和没有标签的迁移目标数据训练得到具有良好泛化能力的模型,是扩展深度学习应用场景的重要研究方

学位

共同子空间学习的跨模态哈希检索研究

与本文相关的学术论文