论文部分内容阅读
随着移动互联网、物联网、云计算以及云存储等高新技术的发展,数据的存储量呈现指数形式增长,信息社会步入了大数据时代。这些来源广泛、种类繁多、存储量巨大的多媒体数据蕴含着丰富的经济和社会价值,数据的快速增长为信息社会的高速发展带来了新的机遇和挑战。如何对多媒体数据进行快速的存储、处理和分析,已成为大数据研究过程中急需解决的问题。基于哈希学习的近似最近邻检索方法是数据检索领域常用的一种方法,由于其检索速度较快、所需存储空间较小,得到了广泛的应用。在实际应用中,如何对样本海量的多媒体数据进行高效的检索,还有待进一步研究。因此,跨模态哈希检索技术具有重要的研究意义。现存的跨模态哈希检索方法主要关注如何保持不同模态数据间的关联性,忽略了哈希检索方法的泛化能力以及多模态数据分布的复杂性。本文在深入学习字典学习、非参数贝叶斯模型以及非对称哈希等相关知识的基础上,针对现有跨模态哈希的不足之处,提出了两种跨模态哈希检索方法,对现有跨模态方法进行检索性能的提升。本文主要的研究工作总结如下:1.针对现有跨模态方法难以求解最大化内积搜索问题,并容易发生过拟合,忽视了方法泛化能力,提出一种非对称跨模态哈希检索方法。利用非对称哈希的思想,对各个不同模态的数据学习两个不同的哈希函数,有效地求解最大化内积搜索问题,并增加跨模态检索方法的泛化能力以防止过拟合现象的发生。同时,利用字典学习方法中成对数据具有相同的表示系数或表示系数之间具有线性映射关系这一假设,将哈希编码与数据的监督信息结合,对不同模态的数据学习统一的哈希码,有效地保持了不同模态数据之间的语义关联性。2.针对现存跨模态检索方法假设数据服从高斯分布,不能有效地描述数据的实际分布这一不足,提出一种基于非参数贝叶斯的监督跨模态哈希检索方法。利用狄利克雷过程作为数据类别均值的先验,对数据分布进行建模。同时,建立概率图模型,描述原始数据、数据监督信息以及哈希码三者之间的关联,获取原始数据和二进制编码之间的后验概率分布,利用概率分布生成哈希函数,学习统一的哈希编码,使编码能更好的近似原始数据。充分的实验结果表明,本文提出的非对称跨模态哈希检索方法显著地增加了跨模态检索的泛化能力和灵活性,基于非参数贝叶斯的监督跨模态哈希检索方法较好地描述了多模态数据的分布,提高了哈希检索的精度,表现出良好的检索性能。