人物动作识别的局部特征和生成模型研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：qqw2020843

【摘要】

：

本文针对视频中人体动作识别和分类的需求，设计和实现了具有较高准确率的人体动作识别系统。在设计系统的过程中，我们分析和评估了近年来国内外流行的动作检测和识别方法，在此基

【作者】

：

施惟

【机构】

：

上海交通大学

【出处】

：

上海交通大学

【发表日期】

：

2013年期

【关键词】

：

动作检测时-空兴趣点三维局部特征 bag-of-words表示主题模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文针对视频中人体动作识别和分类的需求，设计和实现了具有较高准确率的人体动作识别系统。在设计系统的过程中，我们分析和评估了近年来国内外流行的动作检测和识别方法，在此基础上提出了新的系统和处理实际应用问题的方法；同时我们也进行了系统配置优化和执行效率优化方面的研究，并在公开的理论数据集和实际数据集上对系统进行测试验证，以及和国际领先水平的研究成果进行了比较。本文主要工作包括以下几个方面：(1)设计并实现了模块化的动作识别系统，系统采用流水线结构，降低了各部分的耦合。低耦合设计使得各模块内部使用的算法可以进行任意调整和组合，方便对单个算法和算法间的适用性进行评估。同时保证了整个系统的设计具有可扩展性，使后续的算法改进和功能模块添加非常方便。(2)在算法设计方面，我们使用本系统评估了多种目前国际领先的领域成果，分析他们对动作建模的方法和思路，以及不同方法在不同应用场景下的优势和弊端。我们采用泛化能力较强的bag-of-words表示，对视频检测时-空兴趣点，即沿着时间和空间方向局部变化最为明显的点，在这些点周围提取局部时-空特征。时-空特征采用多种扩展到三维（X轴、Y轴和时间轴）的局部特征方法，并对特征向量作聚类从而数量化表示，由此形成视觉词汇，将一段视频变换为一组视觉单词的集合。形成bag-of-words表示之后，我们设计使用LDA主题模型提取每个视频中的隐含主题，将视频表示为主题上的分布。视频之间的距离通过Bhattacharyya距离衡量，对于目标视频采用判别方法实施最终的分类。(3)对视频的识别过程，我们将其分为单一视频动作分类和长视频动作检测两种需求，对于后者我们设计了基于滑动窗口的高效的分割方法，令其转化为第一类情况处理。(4)我们将系统应用于公开的人体动作视频集以检验其表现，实验表明在公开数据集上，我们的方法与当前国际上最新领先的研究成果相比具有竞争力：在简单数据集上我们的系统优于所有bag-of-words方法，复杂数据集上在比目前国际最佳准确率略低的情况下，执行速度比其快将近20倍。通过实验，我们研究了视觉字典的规模和隐含主题的个数对系统表现的影响，对于今后构建实际投入使用的系统设置方法起到指导性的作用。

其他文献

实用问答系统的研究与实现

“我们正受信息淹没，但却渴求知识。”美国著名未来学家J.奈斯比特一语道出了生活于网络世界的现代人所面临的困惑与尴尬。现在的搜索引擎已经不能满足人们日益增长的知识信息

学位

语言问答系统自然语言处理信息检索

基于影响关系的协作过滤推荐算法研究

　　推荐系统是电子商务应用中最重要的技术之一。推荐系统是根据用户以往的购买或评分记录，根据推荐算法，向用户推荐其他产品的一种实用系统。各国的研究者们为了使得算法产生

学位

推荐系统协作过滤推荐算法K最近邻居K逆最近邻居

龙芯2号多媒体指令集在MPEG-2视频解码中的应用

MPEG-2视频播放器是龙芯系列处理器的重要应用之一。在龙芯2号的早期版本中,MPEG-2视频播放的速度不甚理想,提高龙芯2号的MPEG-2视频播放性能具有十分重要的意义。为了支持多

学位

龙芯2号多媒体指令集IDCT运动补偿MPEG-2视频解码

软件生产线中角色模型的研究

软件生产线是一个以软件工程为背景发展而来的、新兴的、多学科交叉的研究领域;涉及软件技术、管理技术和商务规划等多个方面,几乎覆盖了软件工程的所有领域;软件生产线已成

学位

软件生产线软件体系结构领域建模角色角色模型

基于多核SMP集群的并行图像压缩研究

随着高清摄像头的大量使用,摄影机和照相机拍摄的图片的分辨率不断提高,在带来高画质图像的同时,这些图像在现行的网络环境下传输速度愈来愈显得不足,特别是一些对实时性有比

学位

混合并行编程分形图像压缩SMP集群MPIOpenMP

基于Rhino3D平台的鞋帮CAD软件的设计与实现

本文介绍了一种基于Rhino3D平台的鞋帮CAD软件的设计与实现。该软件能帮助企业提高工作效率，提升产品质量，具有较好的社会和经济效益。鞋帮CAD软件实际上是一个图形处理软件，它

学位

鞋帮Rhino3DCADB样条图像处理

一种新的小额支付协议MultiPay的研究与设计

随着Internet技术的快速发展与普及，电子商务正以其自身高效、低成本的优势，逐步成为新兴的经营模式，其涉及的领域从银行、外贸、证券市场到贴近我们每个人的日常购物。由于电子

学位

电子支付小额支付宏支付系统MultiPay协议

网络IDS虚警处理技术研究

随着网络入侵行为变得越来越普遍和复杂,入侵检测系统在网络安全中的作用也越来越重要,然而现有的入侵检测系统都没有能很好的解决其虚警率过高的弊端,因而出现了入侵检测系

学位

入侵检测Snort网络安全虚警

综合运行信息管理系统的研究与实现

当今网络迅速发展,网络规模不断扩大,复杂性不断增加,异构性越来越高。建立综合网管系统,以实现包括全网故障分析和故障定位、全网性能综合分析等功能的对全网的综合管理是十

学位

网络管理数据仓库Web Service日志文件

基于视频人脸图像的警觉度估计研究

警觉度通常定义为，对外界刺激长时间的保持注意力和警惕性的能力。人机交互系统中需要操作人员保持足够的警觉度。一些特殊的工作，如空中管制中心的管制员、飞行员和高速公路上

学位

警觉度图像性别分类

人物动作识别的局部特征和生成模型研究

与本文相关的学术论文