面向感知的视频内容表示研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:A55190684
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频内容分析是近年来非常活跃的一个研究方向,其基本研究目的是研制自动化的算法和系统,以便于实现对视频信息的有效组织、管理和再利用。视频内容表示是视频分析系统中的一项重要内容,已成为解决低层特征和高层语义之间的语义鸿沟问题的主要途径之一,其研究目的是通过对视频数据的处理和分析,建立具有语义表征性的内容表示模式,进而实现对视频内容的表达和描述。鉴于其重要地位和功能,论文针对视频内容表示进行了研究。 论文基于视觉认知理论的有关研究成果,构建面向感知的内容表示机制,主要包括三个方面:基于语义单元、基于事件和基于关键帧的内容表示的研究,提出了有效的算法,并用实验验证了这些算法的有效性。 在基于语义单元的表示上,将注意力机制引入视频信息的分析,针对视频序列中的图像帧,提出了一种有效的视频信息显著性分析方法,用于提取符合感知过程中受注意程度高的区域,即显著区域。 由于视频信息的时空特性,单幅图像帧的显著区域不能满足视频语义分析的要求。为了提取更为有效的语义单元,除了需要空域的区域分割外还需要进行时域的分析以获得空域和时域两方面的语义信息。通过显著区域的时空特征一致性分析,论文提出了一种基于时空显著单元的提取算法,得到一个时间段内具有内容一致性的时空区域,即时空显著单元,其内容表征能力在视频序列匹配的应用实验中得到验证。 在基于事件级的内容表示上,根据人对事件的视觉感知特点,论文构建了一个事件级内容表示模型。并在此模型基础上,针对体育视频中的特定语义事件,提出了一种有效的语义事件检测方法。 在基于关键帧的内容表示上,从度量视频序列内容变化程度这个问题出发,提出了一种基于内容冗余度和语义相关性的关键帧提取算法,用以简明扼要地总结视频信息的主要内容,为用户提供了概观视频内容的途径和非线性浏览视频的方式。
其他文献
随着虚拟现实技术的发展,对虚拟环境沉浸感的要求越来越高,各种高沉浸感的虚拟现实环境(如CAVE系统、投影阵列)相继出现,此时对单个场景的渲染已经不能满足这些虚拟现实环境
水土保持基础信息设施建设,是水土保持科学研究面临的重大科学和技术问题之一,也是国家空间基础设施建设的重要组成部分。本文以黄土高原水土保持专题数据为研究对象,对国家
为了应对快速多变的业务需求,越来越多的公司、企业倚重于跨组织协作的模式完成自己的业务目标。动态灵活的跨组织协作对应用集成提出了更高的要求。作为一种新兴的、面向Int
压缩感知(Compressed Sensing,CS)是一个新兴的研究课题,CS一般包括三个方面:信号的稀疏表示、观测矩阵和重构算法。其中,CS的必备条件是信号的稀疏表示,CS的关键点是观测矩阵设计
随着计算机、网络和多媒体技术的迅猛发展,数字文本、图像、音频、视频等多媒体产品得到日益普及和广泛应用,但是数字产品容易编辑、复制、存储和通过网络迅速传播等优点也使版
随着计算机和网络技术的不断发展,以及企业信息化建设的不断深入、软硬件资源的升级和各种应用的扩展,异构数据库访问技术已是数据库研究的一个焦点。因此如何利用现有网络资源
随着下一代网络技术的发展,越来越多的嵌入式设备接入互联网,它们对IP地址、移动性提出了更高的要求。目前的IPv4协议只有32位的地址空间,而且移动性方面存在很多缺陷,已经不
Web挖掘是将数据挖掘技术应用于Web环境,也就是从Web文档或Web活动中发现和抽取潜在的、有效的、新颖的或用户感兴趣的模式和知识。按不同研究对象可以将Web挖掘分为:Web内容
当今世界是互联网的世界,对任何事物或者信息的展现,通过网络途径都是最迅速、最快捷、最广泛的。为了展示西安这座古都的文化元素,我们也借助互联网这一工具,将西安的特征与气质
运动人体的检测与跟踪是人运动分析的重要内容,也是计算机视觉研究的重要领域之一。在智能安全监控、高级人机接口、人体运动细节分析等方面有着广泛的应用前景和经济价值。