基于概率的跨媒体检索方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:wangyang2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
常见媒体类型包括文本、图形、音频和视频等,在越来越多的领域中人们不再满足于采取单一模态对事物进行描述而需要以多种媒体形式对事物进行描述或重现。以此为契机基于语义的跨媒体检索成为了研究热点。跨媒体检索的目标包括多模态媒体互检索和多媒体文档检索,然而在实现这一目标的过程中常常面临着不同模态对象底层特征的异构性和语义鸿沟这两大难题。针对这两大问题,常见的解决方法包括降维法、机器学习、相关反馈以及基于本体的检索模型。典型相关性分析方法的引入,可以在最大程度保留变量相关性的前提下将两种模态对象的底层特征映射至新的同构子空间中,因而在新空间中不同模态对象具有了可比性。在此基础上再运用逻辑回归方法于该同构子空间进而提取媒体对象的语义特征,经过子空间学习的媒体对象,都以语义概率向量的形式统一映射至语义子空间。当多模态对象进行互检索时,检索算法不仅考虑对象之间的语义相关性还考虑同种模态对象之间的相似性,而实现这一方法的途径是通过在语义子空间中构建媒体关联图,并为同种模态对象之间引入转移概率而实现的。当进行多媒体文档检索时,检索算法将不同模态对象的语义特征通过线性加权进行特征融合,从而将多媒体文档检索简化为一种单一模态的检索。实验表明这种基于概率的检索方法能获得较好的检索正确率,且算法开销不高于基于机器学习的跨媒体检索方法。最后运用面向对象的思想进行了检索原型系统的设计与实现,并给出了系统检索过程和结果的展示。
其他文献
近年来,人们对高质量视频流应用的需求不断增长,同时无线频谱资源也日益紧缺。无线接入点及移动设备的大量普及给无线网络视频流传输带来压力和挑战,也为基于无线中继网络的协作
基于轮廓信息的图像模式匹配广泛应用于工业、农业、商业和生活中的各个领域,是计算机视觉中一个重要的研究课题。其现有方法按技术路线可分为自下而上和自上而下两类。其中,自
作为基于位置应用的基础服务,室内定位系统实现了无线环境下的室内位置感知。指纹定位技术利用收集室内环境所能接收到的Wi-Fi或ZigBee信号强度应用机器学习算法来推断当前用
以太网光纤通道(FCoE,Fibre Channel over Ethernet)是一种新兴的存储区域网络协议。可将光纤通道协议帧封装在以太网帧内,通过增强型以太网进行传输,实现现有的传统局域网和存储
超分辨率重建技术是通过融合多帧同一场景的低分辨率图像得到一个更高分辨率、更清晰图像的技术,是图像增强的主要分支。但是现存算法仍存在着噪声鲁棒性不强的问题,算法难处理
随着信息技术的飞速发展和用户需求的不断增加,软件开发技术呈现出多样化的发展趋势,其中比较有代表性的编程语言是Java语言。Java语言的广泛应用,提高了软件的开发效率,但给查找
随着深亚微米集成电路系统的快速发展,人们对数字集成系统的需求也在不断提高,希望能在同一块硅片上实现更多的逻辑功能,由此可编程逻辑门陈列(FPGA)已逐渐成为集成电路设计
视频编解码一类的多媒体流计算不仅计算复杂度高,而且计算过程中需要进行密集数据访问。片上多级Cache可以缓解计算速度与数据存取速度之间的差距。但是,片上Cache空间通常非常
随着数据库技术和信息网络的快速发展,越来越多的数据被收集,发布和使用。一些基于互联网的企业也储存了很多相关的敏感隐私信息,这些信息一旦被泄漏,会给企业的发展带来严重的后
全文检索系统所面对的数据集通常是不断增长的大量文本集,为了及时处理新增的文档以满足用户的实时检索需求,高效的在线倒排索引更新策略显得尤为重要。现有的倒排索引更新策略