基于均值逼近哈希的交叉模态检索方法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:dongfsq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的高速发展为我们的生活带来大量的多模态的数据,而在多媒体数据中进行检索也成为了大多数人的需要。顾名思义,交叉模态检索是一种能在不同模态中进行检索的技术,以其有效且高效的特点,在多媒体数据检索中受到了大量研究人员的关注。而哈希技术的出现,能将海量的数据通过投影转化为二进制代码,大幅度降低了存储空间和检索时间要求,其又将交叉模态检索技术往前推进了一大步。当前的主流方法是利用联合矩阵分解方法学习一个共同的子空间来进一步得到统一的哈希码,以便异构的数据能通过其进行交叉模态检索。但这种方法仍然存在不少缺乏之处。首先,这些方法大多只注重保持数据的局部性,而忽略了矩阵分解过程中保留重建残差。其次,将数据投影到共同语义空间时,没有考虑到数据的能量损失。最后,由于不同模态的数据具有不同的性质,将异构的的数据直接投影到统一的语义空间中是不合理的。因此,不同于大多数采用联合矩阵分解进行交叉模态检索的方法,本文首先使用标签信息构建相似图,然后通过类PCA将异构数据特征保留到不同的子空间中,再将不同子空间通过全局相似图相互逼近,后提出均值逼近的方法将不同的语义空间整合到同一子空间来得到统一的哈希码,简称为均值逼近哈希(AAH),其主要的研究成果如下:(1)AAH利用标签信息构建局部相似图并将其嵌入重构框架中,在对原数据进行重构拟合和降维过程以保留模态的重构残差;AAH在重构中引入类PCA变换矩阵,保证重构后的语义空间能保持数据的主能量。(2)AAH提出将异构的数据投影到不同的语义空间中,使不同的语义空间能保留不同的模态特性,然后AAH使两个语义空间在整体和局部都相互靠近,使得不同语义空间得语义相互靠近,以便于得到一个共同的哈希码;(3)AAH采用平均近似策略,将不同模态的重构语义空间的平均值拟合逼近统一的哈希码,使得学到的统一哈希码能同时保留不同的模态信息。在众多实验中被广泛使用的三个标准数据集上的比较实验表明,本文提出的AAH方法优于当前的数个最新且稳定的交叉模态哈希方法。
其他文献
滑板运动以滑行为特色,是一种崇尚自由、富有挑战性的运动方式。随着越来越多的人参与到滑板运动中,滑板运动已经成为奥运会的正式比赛项目,但目前国内专业的滑板场地有限且该项运动存在一定的危险性。为了让更多的人体验到滑板运动所带来的乐趣,并且在体验过程中尽可能减少场地的限制和避免摔倒、受伤等现象,本文以滑板运动为载体设计一款电子滑板产品。它将户外滑板运动游戏化、室内化,是一款电视游乐器产品,同时也是一款体
如今是智能手机和平板电脑风靡的时代,它们的出现也在一定程度上刺激着移动通信技术的发展。在人们对通信技术提出更高要求的情形下,第五代移动通信技术(5G)逐渐发展起来。5G相较于以前的移动通信技术在通信带宽、覆盖广域、低延时等方面提出了更高的要求,对射频功率放大器而言,5G新标准对的其研发设计提出了更大的挑战。首先射频功率放大器的宽频带性能直接影响到通信信号传输质量,其次射频功率放大器在输出功率较大的
针对目前织物人工开幅流程效率低、国内设备尚未有稳定的产品进入市场、国外半自动化设备操作相对复杂且通用性一般的现状,本文以“复杂纹理背景织物开幅的特征提取及系统研发应用”为题,重点研究提高自动开幅设备的通用性。结合深度学习算法与传统图像处理方法,完成对多种不同纹理特性的织物的自动开幅。本文研究的自动开幅系统,其主要的算法设计分为两大部分:一是利用深度学习完成对织物纹理特性的分析与分类;二是根据织物纹
随着智能制造技术的不断进步,机器人在制造业生产中发挥着越来越重要的作用。分拣机器人是工业机器人中的一类,它能代替工人对流水线上的工件进行分拣。传统分拣机器人采用示教或离线编程来规划抓取方向和运动路径,虽然能完成分拣作业,但该类型分拣机器人对工件的摆放位置和尺寸要求较严格,如果待分拣工件的摆放位置和尺寸发生变化,容易导致机器人抓取工件失败。基于机器视觉的分拣机器人能对工件进行实时检测和分拣,具有灵活
嗅觉是人类的一种生理感官,它通过感知空气中的化学物质了解环境。相对于视觉和听觉对应的视频和音频的数字化发展,作为人类感官之一的嗅觉,在数字化的道路上,还有着巨大的挑战。气味描述符是气味感知的一种描述方式。由于气味的复杂性,人们至今还难以理清气味物质的理化特征与气味描述符之间的映射关系。因此,没有建立起根据气味物质理化特征预测物质的气味描述符的通用方法。本文研究了从物质的理化特征预测物质的气味感知空
当今社会人们对商品包装质量越来越敏感,乳液泵盖作为洗液产品容器的重要组成成分,在产品注塑生产及搬运过程中可能产生表面污渍、缺胶、划痕、毛刺和摩擦纹变形等问题,因此产品表面缺陷检测环节越来越受生产厂家的重视。本文针对乳液泵盖的不同表面的特点和检测要求,搭建视觉检测实验平台,设计机器视觉软件算法,设置三个检测工位分别对泵盖底面、侧面和顶面3个方向进行检测,本论文的主要工作内容如下:1、搭建乳液泵盖缺陷
随着5G时代的到来,移动用户设备数量的快速增长,所产生的数据流量也呈指数增长,给蜂窝网络中的基站带来巨大压力。虽然5G通信基站已经逐步普及,但以固定基站为主的5G通信网络,仍然会面临挑战。蜂窝网络中的基站运行负载有限,在面对临时的爆发性流量时,当流量规模超过基站运行负载,就会造成网络拥堵,影响用户体验质量(Qo E)。支持无人机的移动边缘计算是解决该问题的有效方法之一。如若能够预知潜在的爆发性流量
大数据和云计算的快速发展,使得人们可以方便地将海量信息上传至云服务器中存储,或者利用它的强大运算能力为自己服务,与此同时,也给人们带来了诸多信息安全问题。密文域可逆信息隐藏作为一种可确保隐蔽载体内容的前提下,还可在密文载体中隐藏秘密信息的技术,可有效地保障密文传输过程中的安全问题,同时方便云端管理者对海量信息的管理。因此,研究密文域可逆信息隐藏算法是近年来密码学领域的一大热点。加密后生成空间算法(
随着人们日常生活对室内定位需求不断提升,室内定位技术日益受到国内外学者的关注。现有的室内定位平台大多聚焦于二维平面的定位,对垂直方向的定位研究较少,难以应对当今社会对室内三维定位的需求。目前室内三维定位技术发展的瓶颈主要体现在垂直方向的定位上,因此,在成熟的二维定位基础上,改进楼层定位技术,提高室内定位的服务质量,成为室内三维定位技术突破的当务之急。当前已有的楼层定位方法受室内环境、技术手段等因素
近年来,以LCC谐振拓扑作为主功率电路的高压直流电源由于具有兼容高压变压器寄生参数、工作高效的优点,在静电纺丝、静电除尘和X光机等领域得到广泛的应用,具有良好的发展前景。为了获得较高的输出电压,单级拓扑结构的高压直流电源必须具备较大的匝比,由此带来的较大寄生参数限制了频率的提升,增加了系统的设计难度。级联型高压直流电源能够减小变压器的升压压力,降低寄生参数的影响,有效地克服了以上缺点。因此,研究级