基于视觉注意的视频分析

来源 :中山大学 | 被引量 : 0次 | 上传用户:angieho
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机科学的发展与视频数据存储传输能力的提高,基于视频的各种应用引起了研究人员的兴趣,视频分析正逐渐成为计算机视觉领域的一个研究热点。面对数据量庞大的视频信息,如何提高视频分析的效率,有选择性获取所关注目标的信息,是研究者们共同面对一个挑战。其中,通过借鉴人类的视觉注意机制而建立的计算模型,能有效地提取出包含关键信息的显著区域,提高视频处理分析的效率,同时也能提高对噪声的鲁棒性。   本文的研究模拟了人类视觉系统的视觉注意机制,利用视频特有的三维时空特性,将传统的仅仅利用空间信息构造的基于图像视觉注意模型扩展到视频的三维空间中,使时域与空域的显著性互相融合而形成视频中显著图。在视频分析处理中,通过建立的视觉注意模型,进一步获得视频中的显著区域,消除冗余的视觉信息,将运算集中在显著区域,从而提高视频处理的速度,满足视频应用实时性的要求。在本文中,视觉注意模型具体被应用到视频中人的动作检测。传统基于时空梯度特征提取与子块匹配的人体动作检测模型需要在时空三维空间进行大量的匹配操作,该方法存在耗时高的不足。通过结合本文提出的基于视频的视觉注意模型,可以大大提高运算效率,而且能提高算法对噪声的鲁棒性。   本文研究的重点与创新点在于:1)研究如何提取视频的三维时空特征并结合进视觉注意模型的建立中,包括利用视频中的运动信息、时空域上的梯度信息,建立具备时空多尺度分析功能的模型;2)建立视觉注意模型后,研究如何将提取的显著区域结合到视频分析的过程中,并结合多分辨率分析,避免将运算耗费在非运动区域或非显著的噪声区域,从而有效提高算法的运算效率。   实验表明,本文提出的方法能有效地提取视频中的显著区域,并在视频中人体动作检测这一具体的视频分析应用上能大大提高算法运行速度,改进检测效果,而且对视频中的噪声具有一定的鲁棒性。  
其他文献
随着多媒体技术、因特网传输以及数字电视技术的发展,数字视频技术已经得到广泛的应用,如何有效的存储、管理及查询所需信息已经成为亟待解决的问题,作为获取视频信息的重要
Turbo码具有逼近Shannon限的性能,它的出现是信道编码发展史上的一个里程碑,现在已经成为3G中重要的编码方案。对Turbo码的研究具有相当重要的理论以及实践意义。本文从性能分
随着数据、图像、视频等多媒体业务的出现,人们对带宽和性能的要求不断提高,一系列的技术标准相应出台,WiMAX技术也是在此背景下脱颖而出。WiMAX采用OFDM技术、自适应调制与
随着高清数字电视、移动视频等新应用的日益广泛,以及人们对更高的色彩还原与展现的期望,使得H.264/AVC与AVS等第二代视频编码标准也开始难以应对这些新的需求,ITU与MPEG组织都
近年以来,雷达微多普勒研究方兴未艾。随着我国相继建成了一大批大跨度和超大跨度桥梁,桥梁的安全性和耐久性已成为人们关注的热点。研究桥梁的微多普勒现象有助于深入了解桥
在眼科临床中,海德堡视网膜断层扫描仪(HRT)是用来获取和分析眼睛后段三维地形图的共焦激光扫描系统,该仪器获得的三维图像是由一系列二维剖面图构成,由三维图像可以计算出地
嵌入式多媒体传输终端作为一种网络多媒体传输系统是能够同时进行多种媒体通信的终端设备,具备多种媒体的采集和展现能力,具备较强的处理能力以完成信息编解码以及媒体通信的能
学位
随着信息技术、网络技术和多媒体技术的飞速发展,人们对视觉享受的要求一直在不断提高。多视角立体视频系统不但可以提供给用户高清晰视频质量的立体视觉享受,而且可以满足用
随着信息社会计算机通信技术和互联网技术的迅速发展,信息安全成为社会各个领域热点问题,密码系统作为其基本技术手段也得到广泛关注。混沌是非线性动力学系统特有的一种运动
生命探测雷达是近年新兴的一种新型雷达系统,可以在不接触生命探测体的情况下,利用电磁波穿透性强的特点,透过有形介质进行探测,其应用的范围广泛,可在灾后救援(搜救地震幸存者)、反