基于非对称哈希的跨模态检索方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:sdggertretfdhghdfh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网、物联网、云计算以及云存储等高新技术的发展,数据的存储量呈现指数形式增长,信息社会步入了大数据时代。这些来源广泛、种类繁多、存储量巨大的多媒体数据蕴含着丰富的经济和社会价值,数据的快速增长为信息社会的高速发展带来了新的机遇和挑战。如何对多媒体数据进行快速的存储、处理和分析,已成为大数据研究过程中急需解决的问题。基于哈希学习的近似最近邻检索方法是数据检索领域常用的一种方法,由于其检索速度较快、所需存储空间较小,得到了广泛的应用。在实际应用中,如何对样本海量的多媒体数据进行高效的检索,还有待进一步研究。因此,跨模态哈希检索技术具有重要的研究意义。现存的跨模态哈希检索方法主要关注如何保持不同模态数据间的关联性,忽略了哈希检索方法的泛化能力以及多模态数据分布的复杂性。本文在深入学习字典学习、非参数贝叶斯模型以及非对称哈希等相关知识的基础上,针对现有跨模态哈希的不足之处,提出了两种跨模态哈希检索方法,对现有跨模态方法进行检索性能的提升。本文主要的研究工作总结如下:1.针对现有跨模态方法难以求解最大化内积搜索问题,并容易发生过拟合,忽视了方法泛化能力,提出一种非对称跨模态哈希检索方法。利用非对称哈希的思想,对各个不同模态的数据学习两个不同的哈希函数,有效地求解最大化内积搜索问题,并增加跨模态检索方法的泛化能力以防止过拟合现象的发生。同时,利用字典学习方法中成对数据具有相同的表示系数或表示系数之间具有线性映射关系这一假设,将哈希编码与数据的监督信息结合,对不同模态的数据学习统一的哈希码,有效地保持了不同模态数据之间的语义关联性。2.针对现存跨模态检索方法假设数据服从高斯分布,不能有效地描述数据的实际分布这一不足,提出一种基于非参数贝叶斯的监督跨模态哈希检索方法。利用狄利克雷过程作为数据类别均值的先验,对数据分布进行建模。同时,建立概率图模型,描述原始数据、数据监督信息以及哈希码三者之间的关联,获取原始数据和二进制编码之间的后验概率分布,利用概率分布生成哈希函数,学习统一的哈希编码,使编码能更好的近似原始数据。充分的实验结果表明,本文提出的非对称跨模态哈希检索方法显著地增加了跨模态检索的泛化能力和灵活性,基于非参数贝叶斯的监督跨模态哈希检索方法较好地描述了多模态数据的分布,提高了哈希检索的精度,表现出良好的检索性能。
其他文献
机器类通信的发展使得接入通信系统的终端数量急剧增加,为了应对终端大量连接的问题需要进一步提升通信系统的容量。本文在现有通信体制的基础上,提出了将OFDM信号和CDMA信号
随着中国经济的不断发展和重大项目的不断建设,征地拆迁的任务也越来越多。在征地拆迁的过程中,虽然有国家以及省、市、区相关的征迁文件的支持,但在现实的工作中,仍然会遇到
多处理器系统具有良好的可扩展性,它可以满足大型数据库的高性能需求。在多处理器系统中,影响其查询效率的一个重要的因素就是查询调度。虽然国内外学者对于查询调度的研究层
随着云计算的飞速发展,人们的生活得到了极大的改善。数据的日益增长使得用户开始使用云存储服务。而这种数据外包的方式,导致用户无法完全把控自身的数据,同时数据的安全性
藏语文教学与学生的学习效率主要取决于教师对藏语文教学任务的认识程度。教学任务是指教师在教学过程中以各个教学阶段的教学目标为依据所实施的课堂实践。在教学阶段的时间
在移动互联网时代,智能移动设备承载了用户大量的隐私信息,因此正确的用户鉴权认证成为安全访问这些敏感数据的首要前提。传统口令认证方式可能遭受越肩偷窥,指纹与人脸识别
随着视频技术和应用的发展,特别是高清(HD)、超高清(UHD)、3D和多视点(Multi-View)视频技术的兴起,产生的视频数据量在急剧增加,尽管近年来网络带宽和传输能力增加迅速,但仍
在传统的异构蜂窝选择方案中,存在上下行链路覆盖不平衡以及宏蜂窝终端的上行传输信号对小蜂窝基站的干扰等问题。蜂窝范围扩展技术与几乎空子帧技术等被认为是解决相关问题
随着计算机科技的发展,许多实际应用领域涉及到大量空间目标对象,空间关系反映空间目标的几何位置及属性之间的关系,它是人工智能、空间数据库、地理信息系统(GIS)、机器人学
随着网页检索技术、社交网络、生物信息科学的快速发展和人脑计划实施,图论知识和算法得到了广泛应用和发展。图领域数据规模正以前所未有的速度急剧增加,云计算技术的飞速发