基于深度学习的人体骨架动作识别

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:liongliong603
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代信息技术的发展,视频信息获取设备得到广泛应用。基于图像、视频和骨架等数据集的计算机视觉研究得到快速发展。特别基于深度学习方法的人体动作识别逐渐成为计算机视觉领域的研究热点,在自动驾驶、手势控制和人机交互等领域具有广泛的应用价值。基于骨架数据集的人体动作识别相比于视频图像人体行为识别方法鲁棒性强,不受光照、遮挡和背景颜色混入等因素影响。越来越多的研究者投入到基于人体骨架数据的动作识别当中并取得了显著的成果。本文基于深度学习的人体骨架数据提出三种不同的模型:基于双流卷积神经网络的网络模型、基于卷积和循环神经网络相结合的模型和基于多流卷积神经网络的模型。(1)针对传统卷积神经网络模型动作信息提取不充分的问题,本文根据双流结构思想,提出基于双流卷积神经网络的人体骨架动作识别网络模型。原始骨架序列作为一支流的输入数据,注意力机制增强骨架序列或骨架时域差分序列作为另一支流的输入数据。双流卷积神经网络从两支流输入数据中充分提取动作特征信息,并选择合适的融合方式进行特征融合,证明双流特征融合的卷积网络模型对于检测结果的提升具有很大的帮助。(2)针对循环神经网络过度关注骨架的时间依赖关系,但对空间结构的骨架信息提取不充分的问题,采用循环神经网络和卷积神经网络相结合的方法,提出基于卷积和循环神经网络相结合的人体骨架动作识别网络模型。时间模块采用长短期记忆(LSTM)神经从整体、局部和细节三个分支提取时序特征,空间模块由卷积神经网络构成提取空间特征。成功解决了空间信息特征提取不充分的问题。(3)针对人体骨架序列的时空共现性信息特征提取不充分问题,本文采用时域差分和空域差分的方法对骨架时空特征进行描述。结合图卷积网络对卷积核的设置方式,提出基于多流卷积神经网络的人体骨架动作识别模型。此模型以经典的分层共现网络模型为基础,首先对骨架动作进行新型建模,然后对网络模型进行多支流设计和特征融合方式选择。每一支流的卷积神经网络从原始骨架数据、时域差分和空域差分数据中分别提取骨架动作的时间特征信息、空间特征信息和时空共现特征信息,并选择合适的融合方式进行特征融合。针对以上三种模型分别在骨架数据集上进行验证,通过大量实验分析并与先进的网络模型对比,充分证明模型的有效性和先进性。
其他文献
垂直腔面发射激光器(VCSEL)相较于边发射激光器具有发散角小、圆形光斑易于与光纤耦合、单纵模工作、易于二维阵列集成、晶圆级测试、造价较低等优势,在很多领域已逐步取代其
得益于移动互联技术的广泛推广和“云计算”的横空出世,社会经济生产方式、经营模式均发生巨大变革。但与此同时,作为芸芸众生的每个个体也丧失了独处的自由,无时无刻不活在
高校应用型专业教学必须突破传统课堂形式,各种教学形式都必须突出实践。本文《旅游英语》和《旅游规划》课程为例,分析了应用型专业课程教学中的实践问题,结果表明将模拟或
当前中小学教师不健康心理主要表现为职业适应不良、职业倦怠和人际交往障碍.其原因是多方面的,如来自职业本身的压力、来自教师自身的个人因素以及教师管理中存在的问题.因
目的比较处于生长发育高峰前期和位于生长发育高峰期的地包天患者进行前方牵引的疗效差异,探讨使用前方牵引治疗地包天的最佳时期。方法本实验选择48例骨性前牙反合,设计采用
鲜食葡萄优良品种户太8号长势旺盛,抗病强、易管理,果实早熟、优质、高产,颇受消费者喜爱。简述了其在广东佛山地区的设施避雨栽培技术,整形修剪、花果管理、肥水管理、病虫
目的分析老年人抗利尿激素分泌异常综合征(SIADH)的临床特点,提高诊治水平。方法回顾性分析20例老年(>65岁)抗利尿激素分泌异常综合征患者的病因、发病机制、临床表现、实验
随着人类社会的发展,能源短缺和环境污染问题日益严峻,可控热核聚变能的发展对解决这些问题具有非常重要的意义。在核聚变反应堆运行时,面向等离子体材料(PFM)发挥着至关重要
该文首先应用散射矩阵的Wishart联合分布推导了高斯分布散射矩阵的Stokes参数分布,利用极化不变量思想得到了全部4个Stokes参数分布相当理想的理论结果,并与前人的结果进行了
采用LabVIEW可视化编程语言进行了十字交叉路口虚拟交通灯仿真设计,每个方向信号灯分别由直行、左转、右转3个灯组成,每个灯都有红绿黄三种颜色按规定时间点亮,以维持交通安