基于Markov图模型的特征哈希算法

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:delicious_bupt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,社交媒体、视频网络等多媒体数据成指数级增长。如何快速有效地获取用户所需要的多媒体信息,已经成为迫切需要解决的问题之一。在海量、高维的多媒体数据面前,传统的检索方式已经难以满足人们的需求。因此,对于大规模高维数据检索算法的研究就显得十分重要,也成为近年来国内外的研究热点。针对这一问题,研究人员开始采用哈希的算法将高维空间数据转换成二进制的哈希码,通过哈希码之间的汉明距离来表征原始数据的相似程度。采用哈希算法的优势主要有以下两个方面:(1)哈希编码是由二进制表示,可以大大降低原始海量数据的存储量;(2)计算机可以采用位运算的方式,快速计算哈希码之间的汉明距离,以实现对海量数据的高效检索。本文提出了一种基于随机游走的无监督图哈希学习算法,用于实现大规模数据的最近邻搜索。本文借鉴Markov图聚类算法,构建的Markov图模型不仅描述了数据之间的直接关系,同时也描述了数据各自邻域对其的影响;通过在Markov图上的随机游走,并指数加权结合各步转移矩阵,使得相似数据更加紧密,不相似数据更加疏远,从而获得较为稳态的数据关系网络。最后根据谱图划分理论,采用Laplacian特征分解算法实现在低维流行空间保持原始高维Markov图的网络结构。由于Markov图模型的构建与分解,存在计算复杂度较高、训练成本代价大的缺点。本文借鉴基于Landmark的快速谱聚类算法的思想精髓,进一步地提出了一种改进的快速随机游走图哈希算法。通过理论分析和实验验证,在不降低检索精度的基础上,大大降低哈希学习算法的训练时间复杂度。本文在四个国际公认的大规模图像数据集上,与主流的无监督哈希学习算法进行对比。实验结果表明,本文提出的哈希学习算法普遍优于主流的哈希算法。具备良好的检索性能。
其他文献
容迟网络泛指因节点移动、链路间歇连通等原因而使得通信链路经常处于中断状态、没有稳定的端到端传输路径的无线自组织网络。容迟网络的主要特征是网络拓扑动态变化、时延大
随着无线传输技术的发展,基于IEEE802.11协议的无线局域网(WLAN)得到了大规模的部署,同时WLAN上的典型应用如实时语音应用随之出现。实时应用对传输延迟和抖动比较敏感,而WLAN下
完善、通用、标准的零件库是制造业信息化强有力的基础支撑技术之一,企业采用此零件库技术可大大提高企业零件数据交换效率,便于产品全生命周期各阶段的管理和应用,实现企业
指纹识别系统在很多领域得到广泛的应用,但当今市场上的指纹识别系统厂商所提供的指纹识别应用系统和解决方案,从指纹识别应用系统到指纹识别软件开发包,无论是系统集成还是
随着计算机与计算机网络中软件系统越来越大型化与复杂化,对软件系统的性能要求也越来越高。自动控制发展的一个重要趋势是不断扩大应用领域,其中包括控制理论与方法在软件系
近年来毫米波技术迅速发展并且逐渐得到了广泛的应用,其中毫米波压控振荡器作为毫米波射频收发机中的关键部分也逐渐引起了广泛的关注。压控振荡器对于接收机和发射机的性能有
XML是W3C推荐的一种通用标记语言,凭借其自描述性、可扩展性、半结构化等特点,逐渐成为Web上数据表示和交换的标准,在多个领域都有广泛应用。随着XML文档的大量涌现,如何从海
从60年代开始人们由于应用的需要就提出了虚拟机技术,从硬件到软件都有。随着计算机技术的飞速发展,CPU的速度越来越快,存储容量越来越大,虚拟机技术也如雨后春笋般地发展起
目的 探究氯吡格雷在急性心绞痛治疗中的疗效.方法 选取2018年1月至2020年1月收治的38例急性心绞痛患者进行研究,通过采用随机数表分组,分为对照组和观察组,每组19例,对照组
RTU(Remote Terminal Unit,远程终端单元)是构成SCADA(Superviser Control And Data Acquisition,数据采集与监控)系统的核心设备。它的作用是能对现场各种信号进行数据采集、