视频语义特征提取的研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:pk8984812
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络和存储技术的飞速发展,视频等多媒体数据呈几何级数增长,如何从浩如烟海的数据资源中实现视频数据的检索成为人们关注的问题。现有的视频检索系统技术多是基于低层特征的检索,与人类所能理解的高层语义概念相去甚远,这严重地影响视频检索的实际效果。如何使计算机能自动挖掘视频中的语义信息,并有效地利用高层特征进行视频检索,已经成为多媒体研究领域中一个亟待解决的问题。由于视频语义内容的复杂性、模糊性以及主观性使得低层视觉特征和高层语义之间存在着“语义鸿沟”。如何跨越语义鸿沟,目前还不能完全解决,实验表明,如果能从视频语义中提取出符合人类认知的高层语义,用语义作为描述视频信息的特征进行检索,将成为解决低层特征到高层语义间鸿沟的有效途径。现有的视频语义提取的方法主要有两种:基于规则的方法和基于统计学理论的方法。基于规则的方法是利用领域知识来定义感知规则,并以此检测视频中出现的语义概念。由于其对于领域知识的依赖性很强,所以此类方法很难扩展到其它领域中去。基于统计学理论的方法主要是指概率统计学习方法,由于其与相关知识领域无关,通过训练样本语义的概率关系有效弥补了低层特征到高层语义之间的语义鸿沟。本文主要研究基于统计学理论的方法,希望通过从视频中提取符合人类认知的高级语义信息,即为视频关键帧作语义标注,以此来尝试跨越或缩小“语义鸿沟”。为此,本文首先从“语义鸿沟”产生的原因出发,介绍了当前解决这一问题的思路和方法;介绍了语义提取研究的相关理论;描述了一些经典算法的原理、步骤和实验过程,包括K临近算法、朴素贝叶斯算法、高斯核函数以及支持向量机等的算法,通过分析对比了各种算法在视频语义提取应用中的优缺点。在此基础上,提出了考虑语义重要性的SID算法,并着重介绍了SID算法提出的背景,目的及算法描述。通过实验表明,SID算法明显优于上述提到的其它算法,在视频语义提取上取得了较好的效果。
其他文献
SOA (Service Oriented Architecture,面向服务的架构)作为下一代的软件开发理念,对现代软件开发模式产生了深远的影响。SOA通过服务的发布、服务的发现以及服务的调用等机制
近些年来,随着社会的发展,信息无障碍的研究与发展越来越受到重视,其中一个很重要的技术就是手语识别和手语合成技术,这种技术的发展为聋人和正常人之间的自然交流提供了一个
ARM架构的嵌入式处理器和嵌入式Linux操作系统的完美结合,引发了远程监控系统新的技术革命:由于其优异的性能和高的性价比,被广泛地应用到各种电子产品的设计当中;并且越来越
目标跟踪技术的研究是计算机视觉、图像处理和模式识别领域里非常活跃的课题,目前正广泛地应用于军用和民用等各个领域。本文研究的主要内容为如何将目标跟踪技术应用到实验
软件测试在软件开发过程有着越来越重要的地位,它贯穿于软件定义与开发的整个周期即整个软件开发过程。而测试用例的生成设计又是软件测试过程中的重点和难点所在,它的设计依
“软件即服务”已经成为软件发展的趋势,动态电子商务正是这一思想的结果。目前电子商务应用中存在着商务流程的频繁更新,企业异构平台上不同系统之间收集、归纳、整合和传播
图像配准是图像处理领域的基础问题,它是将不同时间、不同传感器或不同视角下获取的同一场景的两幅或多幅图像进行匹配、叠加的处理过程。图像配准是图像镶嵌、目标识别、图
随着计算机和网络技术的快速发展,互联网流媒体技术广泛应用于网络直播、视频点播、远程教学等领域。但传统的基于C/S架构的服务模式很容易引起服务器的性能瓶颈和带宽瓶颈,
随着高铁项目的目益增多和建设范围的逐渐扩大,各类隧道工程的突发事故对隧道施工人员的安全保障及紧急救援带来了新的挑战。如何把事故的人为管理因素降到最低点,并且在事故
作为增加虚拟场景真实感的关键技术——阴影的实时渲染技术,在三维游戏、动画影视、三维地理信息系统、计算机辅助设计和制造等多方面得到广泛的应用。阴影效果在真实感图形