基于时空金字塔稀疏编码的动作识别

来源 :天津大学 | 被引量 : 0次 | 上传用户:kick3160288
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于视觉的人体动作识别是模式识别、计算机视觉和图像处理等多个学科的交叉研究课题,在人机交互、基于内容的视频检索、运动视频分析和智能视频监控等领域有着深远的理论研究意义和很强的应用价值。由于人体动作的多样性、摄像机位置和复杂环境等因素使得动作识别至今仍然是一个非常具有挑战性的课题。本论文在动作识别的主要框架BoW模型和支持向量机方法的基础上,提出了人体动作识别的改进方法-时空金字塔稀疏编码方法,用于视频中的人体动作识别。本文将空间金字塔匹配方法扩展到视频分析中,同时结合稀疏编码方法,从时间和空间两个维度来描述视频,根据视频中的空间结构以及时间顺序计算视觉词共同出现的次数来识别视频中的动作信息。实验的主要流程是首先从密集光流域提取密集特征点,并利用位移信息形成特征描述符;其次利用稀疏编码方式构建视觉词典来量化特征描述符,同时为视频构建时空金字塔模型;最后对视频进行分类,达到识别视频中人体动作的目的。本文采用了经典的Bag of Words框架来完成整体实验,在训练阶段使用非线性支持向量机和卡方内核训练分类器。为了验证本方法的有效性,我们做了大量的实验,在经典的动作识别数据库KTH、WEIZMANN和Hollywood三个数据库中,本文提出的方法均取得了较好的结果。
其他文献
近年来,随着全国人民生活水平的不断提高,汽车数量的不断增加,与此同时政府也加快了建设基础设施的步伐。目前立交桥、停车场、高速公路越来越多,但是却缺乏合理有效的车辆管
随着社会的发展,人们不仅满足于对个体宏观层次的评价,而是希望能从被试的实际作答反应中获取更多的被试认知结构的信息,以便对被试做出更具体更客观的评价,从而给出相应的补
H.264由于采用先进的帧间预测与帧内预测、整数变换编码及量化、去块效应滤波等技术,获得了比以往标准都好的编码性能,但却增加了编码器的计算复杂度。作为视频编码系统的重要
伴随着Web2.0技术的发展,越来越多的用户更喜欢使用功能丰富、交互性强并且实用性良好的Web应用程序。它允许接收用户的输入值,并将用户输入的值与后台数据库进行交互。然而,如
计算机仿真作为计算机技术的一个重要应用,实际上经历了一个由简单到复杂、由单机到分布式、由同构到异构的一个发展过程。从以往的单独对某一局部的仿真到今天的对某一应用
近年来随着各种新型的传感器不断涌现,遥感技术的提升,我国的高分辨率遥感卫星技术取得了飞速地发展,高分辨率遥感影像的数据级别趋于海量化发展,数据类型也越来越多样化。海量的遥感影像数据带来更多信息的同时也给快速处理带来了很大的挑战。由于卫星周期性旋转的特点,同一个地区在不同时间将会被卫星拍摄到很多次。通过检测同一地区不同时间影像发生的变化,有利于发现该地区地面覆盖变化情况。变化检测算法根据影像分析的层
众所周知,自然界中种群并不是孤立存在的,它们时刻与其它的生物种群存在着相互竞争关系,合作关系以及捕获关系,通过结合种群生态学与传染病动力学建立的生态传染病动力学模型
长距离无线mesh网络LDmesh(Long-Distance wireless mesh networks)因其成本低、带宽高、覆盖广、易于部署的特点,在偏远地区的远程医疗、远程教育以及野外大区域的环境监控等领
随着多媒体技术的发展,以音频、视频和图像信息为主体的多媒体信息逐步取代了文本信息。基于文本标记的传统信息检索技术难以实现对多媒体信息的检索,如何有效、快速地检索多媒
随着计算机软件技术的不断发展,计算机软件已广泛应用于国防建设的各个领域中。然而,很小的软件错误也可能导致整个系统的崩溃。在作战系统中,模型的不一致将导致执行过程中产生