基于Kinect平台融合视频信息和骨骼点数据的人体动作识别

来源 :济南大学 | 被引量 : 2次 | 上传用户:bbswile
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体动作识别是计算机视觉领域研究的热点问题,在智能机器人、视频监控等智能化系统中有着广泛的应用。由于人体运动本身以及运动场景的复杂性,人体动作识别仍然面临着诸多困难和挑战。传统的动作识别依靠单一的数据模式,提取的动作特征表述能力有限,约束了动作识别精度的提高。尤其是相似性动作的识别问题,以及缺少训练样本条件下的动作识别问题。本文在Kinect平台下,重点针对相似性的动作识别及缺少训练样本条件下的动作识别问题,研究了融合视频信息和骨骼点数据的人体动作识别方法。主要工作包括以下几个方面:首先是数据的准备,为了获取动作识别所需的视频和骨骼点数据,我们研究了Kinect的相关硬件组成和功能以及数据解析原理,在此基础上,完成了动作相关的视频和骨骼点数据的同步采集。同时,也做了相应的延伸,开发了两个Kinect模块的数据同步采集系统,可以为后续的研究提供不同角度的数据采集平台。在动作特征的表述方面,结合Kinect提供的骨骼点数据和视频数据,分别进行了两种特征表述的研究。在骨骼点数据的特征提取方面,通过构建关节点运动的速度向量,结合人体骨架结构向量,求取相关角度,表达人体姿态潜在的运动信息,提高姿态的鉴别能力。在视频数据的特征提取方面,通过骨骼点数据定位到彩色图像上的一块感兴趣区域,提取SURF特征描述子,结合词袋模型,表达人体运动的相关特征,针对遮挡导致的人体骨架模型变形的情况,补充有效的判据信息,提高人体动作识别的精度,经过实验验证,表明了特征的有效性。在动作识别的方法方面,首先在单一的数据模式上,重点基于骨骼点数据,针对不同的动作识别任务,提出了不同的识别方法,验证了骨架数据特征的有效性;然后针对存在遮挡,骨骼点错乱,导致骨架变形的情况,研究了如何融合有效的视频信息进行动作识别。在基于骨骼点数据的动作识别方面,针对动作特征表述类内差异大,类间差异小的情况,研究了类内多模板匹配结合PCA最大可分性的方法。考虑类内差异性,从每个动作类别提取若干子类,构造训练模板,将测试样本与训练样本投影到最大可分性的空间进行匹配投票,识别相应的动作。针对相似性动作识别,通过词袋模型构造姿态字典,引入GMM对相似的姿态按照概率软分配,并且考虑类平衡的问题,对算法进行了优化。针对缺少训练样本的情况下,基于One-shot learning的小样本学习的思想,通过K近邻方法从一组训练样本中提取关键姿态。经过筛选过滤,保留了鉴别能力较强的关键姿态,并根据他们对不同类别的贡献率进行加权投票,同时进行了实时的在线测试,取得了较好的效果。在融合视频信息进行动作识别方面,在前述方法的基础上,提出了介于特征层和决策层之间的融合机制,两路数据分别对不同的动作类别进行评分然后再汇总,进入决策层完成动作识别。经过大量的实验验证,表明了我们提出的融合方法可行,同时又具有较好的灵活性。
其他文献
随着互联网技术的不断发展,电子商务的不断兴起,BBS、博客、微博的不断涌现,商家与购买者的网上交互日趋频繁。越来越多的购买者在使用产品后,将产品的评论发表在网上,评论的数量
本文基于BIRIS(双边资源整合)的服务模式,构建一个车辆服务平台,平台收集社会上各式各样的闲置车辆,对车辆资源进行整合,满足客户的多种个性化需求,能充分利用车辆,并提供监控、调度
人机交互(Human-Computer Interaction,简写HCI)是指人与计算机之间进行信息交换过程。但是,由于受到距离以及设备的非便携性等因素,这些设备会增加用户的操作负荷,因此建立
随着信息处理技术和计算机网络的普及,Internet上的Web页面数量呈指数增长,为了快速、方便地处理这些信息,Web文本自动分类技术应运而生,并且已经成为信息检索和文本数据挖掘领域
随着网络信息技术的不断发展,面向在线事务处理(On-Line TransactionProcessing,OLTP)应用的服务系统广泛应用于商业银行、电信公司、证券交易所、航空公司等大型商业金融机构和
蚁群优化算法是一种新的模拟进化算法,具有正反馈、元启发式与分布式计算相结合的特点,其中正反馈有助于算法更快地发现较好解,元启发式特征有助于算法更容易地发现较好解,分布式
社会媒体是人们彼此之间用来分享意见、见解、经验和观点的工具和平台。微博(Micro-blogs)是通过某个社会媒体——如推特(Twitter)或新浪微博——分享的不超过140个字符的文
为了模拟一些在普通情况下无法获得或很难获得的实验数据,比如大型公共场所的踩踏拥挤事件等,需要能够精确地对真实场景中的群体运动进行建模。这些事故的发生本身具有不可预
随着互联网的不断发展,网络信息量日益增加,面对海量的信息,人们对搜索引擎在查全率,查准率以及个性化方面的要求越来越高。查询扩展是个性化智能搜索引擎中的关键技术,它在搜索引
随着时代的发展,网络技术和多媒体技术也迅速的发展起来。通过简单的网上操作,人们可以轻易地获取、发布和传输多媒体数字信息。然而,由于数字作品具有容易篡改、仿造和操作难以