基于多媒体Ontology的跨媒体检索技术研究

来源 :南京大学 | 被引量 : 0次 | 上传用户：laowu000001

【摘要】

：

随着互联网上多媒体音频、图像、视频等多媒体数据数量的迅速膨胀，人们越来越需要一种新的检索方式，使得检索能够跨越不同类型的多媒体数据(如图像、音频等)，从而帮助人们获得多

【作者】

：

宋冬

【机构】

：

南京大学

【出处】

：

南京大学

【发表日期】

：

2008年期

【关键词】

：

跨媒体检索信息检索特征中心集多媒体系统

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网上多媒体音频、图像、视频等多媒体数据数量的迅速膨胀，人们越来越需要一种新的检索方式，使得检索能够跨越不同类型的多媒体数据(如图像、音频等)，从而帮助人们获得多种媒体形式的查询结果。这种新的检索方式就是基于内容的跨媒体信息检索。基于多媒体Ontology的跨媒体检索是实现基于内容的跨媒体信息检索的一种重要方式，它使用多媒体Ontology组织语义信息，并提取出语义的特征表示，通过语义关联实现不同类型媒体之间的跨越。作为一个新兴的研究课题，基于多媒体Ontology的跨媒体检索的研究还不够成熟，仍然存在着一些问题，如多媒体Ontology概念语义的特征表示不够精确、跨媒体检索的精度还比较低等。本文针对如何提高多媒体ontology概念语义的特征表示精度、提高跨媒体的检索精度这两个关键问题展开研究和开发，主要工作包括如下几个方面：　　 (1)提出一种新的概念特征表示方式以提高概念语义的特征描述精度。　　基于多媒体Ontology的跨媒体检索使用特征中心集来表示概念特征。现有的特征中心集结构中，组成特征中心集的各个媒体特征及媒体特征的各个分量对于概念的描述能力相同。这种特征中心集结构导致特征中心集对于概念语义的描述精度有限，并进而导致了跨媒体检索精度的降低。为了提高特征中心集对于概念语义的描述精度，本文提出了一种带权的特征中心集结构，使得组成特征中心集的不同媒体特征之间、媒体特征的各个分量之间存在权重的不同。依据带权的特征中心集结构，本文还改进了媒体样本与特征中心集的相似度计算方法。实验结果显示带权的特征中心集结构提高了概念语义的描述精度，从而也提高了跨媒体检索的精度。　　 (2)改进了基于多媒体Ontology的概念特征提取算法。　　在采用K-MEANS算法提取特征中心集的过程中，由于计算媒体样本之间的距离时没有考虑组成媒体样本的不同维度的媒体特征对距离的影响，加上K-MEANS算法需要事先指定特征中心集的个数，指定错误的特征中心集的个数将直接引起特征中心集的提取的失败，从而影响概念语义的特征描述。为了解决上述问题，提高概念语义的特征描述精度，本文引入了一种改进的K-MEANS算法-X-MEANS算法，并提出了一种在聚类之前对媒体样本进行预处理的方法，以消除在距离计算过程中因媒体特征维度不同而对媒体样本之间的距离产生的影响。实验结果表明X-MEANS算法提取的特征中心集的效果优于K-MEANS算法，提取的特征中心集能够更精确的描述媒体样本的概念语义。　　 (3)提出一种基于多媒体Ontology的跨媒体检索相关反馈机制以提高跨媒体检索精度。　　当前的基于多媒体Ontology的跨媒体检索系统，由于用户提交的低层媒体特征不能很好地表示用户的检索需求以及用户听觉感知和视觉感知等具有主观性，导致了跨媒体检索精度比较低。为了提高跨媒体检索精度，本文引入了相关反馈机制，并分析了相关反馈的处理过程，对处理过程中遇到的一些关键问题进行了研究。实验表明，相关反馈机制的引入使得基于多媒体Ontology的跨媒体检索的检索精度得到了较大的提高。　　本文的研究是在原型系统的基础上开展的。该原型系统面向体育领域，实现了基于多媒体Ontology的跨媒体检索。原型系统中实现了带权的特征中心集提取、多媒体Ontology系统构建、相关反馈、多媒体内容处理等功能模块。实验表明，本文提出的改进机制能够提高跨媒体检索的效果。

其他文献

高分辨率遥感影像中道路提取方法的研究

道路网作为地理信息系统应用的一个基础数据,它的识别、提取和精确定位对于影像理解、制图、GIS数据的更新以及城市规划、交通和测绘方面具有的深远意义。卫星遥感技术的发展

学位

高分辨率遥感影像模板匹配K-均值聚类分割道路提取

AGRS管理与决策支持系统——角色管理与系统配置子系统设计与实现

访问控制(Access Control)就是通过某种途径显式地限制或者准许访问能力及范围的一种措施。自主型访问控制(DAC)和强制型访问控制(MAC)作为访问控制的传统方式，由于自身明显不

学位

视觉图像三维重建中的关键问题研究

三维重建是计算机视觉模拟人眼功能所需要完成的最后一步,即从二维图像获取景物的三维结构信息,具有成本低廉、操作简单、真实感高等优点,有着广泛的应用前景,已成为计算机图

学位

视觉图像视觉图像三维重建三维重建图像重建图像重建计算机视觉计算机视觉几何重建几何重建

基于安全模式的Web安全研究及风险管理

保障软件安全性是软件系统正常运转业务的先决条件，软件安全已引起人们的广泛关注。随着Internet逐步深入人类的社会生活，用户需求的逐步复杂、软件规模的不断扩大，以及开放的分

学位

安全模式风险管理安全成本软件安全软件开发

基于笔和语音的多通道儿童讲故事系统

随着计算机的普及，越来越多的儿童开始使用计算机。无论是在课堂还是在家里，他们利用计算机玩游戏、学习知识，计算机正在逐渐改变儿童的生活、学习方式。讲故事在儿童的成长过程

学位

多通道交

工作流技术在电子政务办公软件开发中的研究与应用

随着社会的发展和政府机构改革的深入，各个政府职能部门之间的协同工作显得越来越重要，电子政务的复杂度日益增加，原有的办公模式已经不能适应日益增长的事务处理、信息共享等方

学位

工作流引擎电子政务JBPM工作流管理系统

基于遗传神经网络的手写体数字识别研究

手写体数字识别,在模拟人工智能、计算机文字处理等方面具有巨大的应用前景。世界各国的模式识别研究者都为此做出大量的研究,提出了很多图像预处理算法和识别算法。然而无论

学位

手写体数字识别遗传算法人工神经网络结构特征

基于XML的数据仓库多维模型的研究与应用

随着企业对决策管理信息需求的不断增加,传统的OLTP(联机事务处理)数据库系统已无法满足客户的要求,数据仓库和OLAP(联机分析处理)技术正是为解决这一矛盾而产生的新的数据库

学位

数据仓库XML多维模型数据立方

对等网络拓扑测量与分析技术研究

对等网络应用在Internet上的日益流行，为Internet乃至整个社会带来了信息共享的革命。准确地测量、深入分析对等网络的拓扑特征，研究对等网络在各种安全事件情景中的可生存性，对

学位

对等网络拓扑测量拓扑分析可生存性

基于网络拓扑测量的IP地址定位系统的设计与实现

近年来,随着互联网的快速发展,越来越多的网络服务需要根据用户IP地址所在的地理位置才能更好地被提供。IP地址与地理位置相关联的过程就称作IP定位。IP定位在如今的互联网服

学位

IP定位IP地址库网络拓扑测量可信度地理位置信息

基于多媒体Ontology的跨媒体检索技术研究

与本文相关的学术论文