基于Markov图模型的特征哈希算法

来源 :江西师范大学 | 被引量 : 0次 | 上传用户：delicious_bupt

【摘要】

：

随着互联网的快速发展,社交媒体、视频网络等多媒体数据成指数级增长。如何快速有效地获取用户所需要的多媒体信息,已经成为迫切需要解决的问题之一。在海量、高维的多媒体数

【作者】

：

刘弘

【机构】

：

江西师范大学

【出处】

：

江西师范大学

【发表日期】

：

2015年期

【关键词】

：

最近邻哈希 Markov图随机游走 Laplacian特征分解

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网的快速发展,社交媒体、视频网络等多媒体数据成指数级增长。如何快速有效地获取用户所需要的多媒体信息,已经成为迫切需要解决的问题之一。在海量、高维的多媒体数据面前,传统的检索方式已经难以满足人们的需求。因此,对于大规模高维数据检索算法的研究就显得十分重要,也成为近年来国内外的研究热点。针对这一问题,研究人员开始采用哈希的算法将高维空间数据转换成二进制的哈希码,通过哈希码之间的汉明距离来表征原始数据的相似程度。采用哈希算法的优势主要有以下两个方面:(1)哈希编码是由二进制表示,可以大大降低原始海量数据的存储量;(2)计算机可以采用位运算的方式,快速计算哈希码之间的汉明距离,以实现对海量数据的高效检索。本文提出了一种基于随机游走的无监督图哈希学习算法,用于实现大规模数据的最近邻搜索。本文借鉴Markov图聚类算法,构建的Markov图模型不仅描述了数据之间的直接关系,同时也描述了数据各自邻域对其的影响;通过在Markov图上的随机游走,并指数加权结合各步转移矩阵,使得相似数据更加紧密,不相似数据更加疏远,从而获得较为稳态的数据关系网络。最后根据谱图划分理论,采用Laplacian特征分解算法实现在低维流行空间保持原始高维Markov图的网络结构。由于Markov图模型的构建与分解,存在计算复杂度较高、训练成本代价大的缺点。本文借鉴基于Landmark的快速谱聚类算法的思想精髓,进一步地提出了一种改进的快速随机游走图哈希算法。通过理论分析和实验验证,在不降低检索精度的基础上,大大降低哈希学习算法的训练时间复杂度。本文在四个国际公认的大规模图像数据集上,与主流的无监督哈希学习算法进行对比。实验结果表明,本文提出的哈希学习算法普遍优于主流的哈希算法。具备良好的检索性能。

其他文献

容迟网络中基于副本控制的单播路由算法的研究与比较

容迟网络泛指因节点移动、链路间歇连通等原因而使得通信链路经常处于中断状态、没有稳定的端到端传输路径的无线自组织网络。容迟网络的主要特征是网络拓扑动态变化、时延大

学位

容迟网络路由算法单播路由副本控制

无线局域网快速切换算法的研究与实现

随着无线传输技术的发展，基于IEEE802.11协议的无线局域网(WLAN)得到了大规模的部署，同时WLAN上的典型应用如实时语音应用随之出现。实时应用对传输延迟和抖动比较敏感，而WLAN下

学位

无线局域网IEEE 802.11协议快速切换切换算法

符合国际标准网络化零件库技术的研究和实现

完善、通用、标准的零件库是制造业信息化强有力的基础支撑技术之一,企业采用此零件库技术可大大提高企业零件数据交换效率,便于产品全生命周期各阶段的管理和应用,实现企业

学位

零件库零件族XMLUMLStruts

基于IP核复用的指纹识别系统的研究与应用

指纹识别系统在很多领域得到广泛的应用,但当今市场上的指纹识别系统厂商所提供的指纹识别应用系统和解决方案,从指纹识别应用系统到指纹识别软件开发包,无论是系统集成还是

学位

IP核复用SoC设计指纹采集指纹识别USB驱动程序嵌入式Linux操作系统

基于QoS的自适应控制中间件研究与应用

随着计算机与计算机网络中软件系统越来越大型化与复杂化,对软件系统的性能要求也越来越高。自动控制发展的一个重要趋势是不断扩大应用领域,其中包括控制理论与方法在软件系

学位

自适应控制系统辨识服务质量区分服务Web服务组合执行引擎

毫米波片上变压器及压控振荡器的关键技术研究

近年来毫米波技术迅速发展并且逐渐得到了广泛的应用，其中毫米波压控振荡器作为毫米波射频收发机中的关键部分也逐渐引起了广泛的关注。压控振荡器对于接收机和发射机的性能有

学位

毫米波片上变压器压控振荡器CMOS工艺调谐范围相位噪声

基于元素层次表达式模型的XML文档相似度计算

XML是W3C推荐的一种通用标记语言,凭借其自描述性、可扩展性、半结构化等特点,逐渐成为Web上数据表示和交换的标准,在多个领域都有广泛应用。随着XML文档的大量涌现,如何从海

学位

元素层次表达式模型XML文档结构聚类相似度计算通用标记语言XML数据挖掘

虚拟机UML下的HIDS的数据采集模块的设计与实现

从60年代开始人们由于应用的需要就提出了虚拟机技术,从硬件到软件都有。随着计算机技术的飞速发展,CPU的速度越来越快,存储容量越来越大,虚拟机技术也如雨后春笋般地发展起

学位

虚拟机虚拟机管理器用户模式的虚拟机主机入侵检测系统调用号

可视化梯形图集成开发环境的设计与实现

RTU(Remote Terminal Unit，远程终端单元)是构成SCADA(Superviser Control And Data Acquisition，数据采集与监控)系统的核心设备。它的作用是能对现场各种信号进行数据采集、

学位

可视化梯形图集成开发软件设计

基于Markov图模型的特征哈希算法

其他学术论文