大规模多模态哈希

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:bainiao528
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着当今互联网的不断发展,人们可以轻易获取到海量的多媒体数据。由于具有低存储消耗和快速查询的特征,哈希学习方法已被广泛地应用在多媒体数据的相似搜索中。尤其是多模态哈希学习,在具有多模态的多媒体数据(如图像和标签)中的应用吸引了越来越多的关注。一般来说,现实应用中的很多数据都带有语义标签的监督信息,因此很多有监督多模态哈希学习方法都利用了这些语义标签来进一步提升搜索精度。然而,大多数已有的有监督多模态哈希学习方法训练过程的时间复杂度都非常高,无法将大规模数据集作为训练数据。本文中,我们提出了一种新的有监督多模态哈希学习方法,称为最大语义关联(Semantic Correlation Maximization)。最大语义关联方法可以无缝地将语义标签信息整合在大规模数据建模中。在真实数据集上的实验结果表明,我们的最大语义关联方法在精度和效率上均显著优于已有的有监督多模态哈希学习方法。
其他文献
信息化建设使得数据库的数量和容量都变得越来越惊人,人们在拥有大量数据的同时却发现缺少真正有用的信息。商务智能作为解决商务活动中各种问题的有效手段,发挥着巨大作用。
随着计算机软件水平的发展,以及各大高校计算机教学水平的提高,对学生编码能力的要求也越来越高。在教学中对代码评估这一环节,传统的手工评估方法已经显得过时。源代码评估
当今互联网正面临一个严重的问题:开放性和安全性。隐私或者敏感数据,例如信用卡信息、登录账号和密码等,很容易在没有经过授权的情况下被网络黑客盗窃。本文提出一种新型的
本文在广泛调研现有自动抄表系统(AMRS)的基础上,结合某小区的抄表自动化需求实现了抄表无人化、信息传输无线化、计费自动化的自动抄表系统。 主要做了以下工作: 1)依据
近十几年来,随着影视动画、虚拟现实、数字娱乐和计算机游戏等领域的不断发展壮大,计算机动画技术在这些产业的推动下也有着巨大进步,而且随着时代的发展,这一技术将会越来越
在虚拟机环境下如何有效的管理各类硬件资源,满足用户按需构建和动态配置的要求,当前还是一个新的研究热点。目前主要的资源配置方式主要有两种:虚拟机资源池和资源静态配置
近年来,流媒体逐渐成为互联网应用的主流。传统的流媒体服务主要采用“客户端-服务器”模式,服务器以单播的方式和每个客户建立连接,而由于流媒体服务处理的是多媒体数据,具
领域工程是实现系统软件复用的关键技术,它为特定领域建立可复用的软件资产,并提供了复用这些软件资产的机制和方法。构件技术是对可复用资产进行分析和实现的技术,能够进一
随着互联网络飞速发展,数据量呈现海量增长,单机存储无法满足需求,分布式存储应运而生并且取得了较大的发展。系统中的数据由于自然灾害、异常故障等原因会遭到破坏,因而需要
在操作系统的设计中,有两种内存分配策略,分别是动态内存分配与静态内存分配。与静态内存分配策略相比,动态内存分配策略允许在运行时动态地申请和释放一定大小的内存,这极大地提