基于卷积神经网络的人体动作识别

来源 :天津大学 | 被引量 : 0次 | 上传用户:leolee19820604
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体动作识别是计算机视觉研究中的热点之一,其目的是从视频中检测并识别目标的动作,使得计算机系统能理解人的动作,对场景进行语义描述,并且在多领域中应用广泛,如智能监控,人机交互等,具有较大的研究意义。虽然现有的许多研究方法都在一定程度上提高了行为识别的准确性,但是由于人体动作的类间差异、类内差异、背景干扰等影响因素,使得对于人体动作特征的提取和识别的仍是一项需要深入研究的课题。本文提出了一个基于对RGB-D视频压缩来建立特征,深度学习作为识别手段的动作识别方案。通过建立三维数据类型的骨骼数据与深度图像数据的联系,将深度序列解析表达为三个层次的结构图序列,分别是整体人形图序列、部分人形图序列和关节点图序列,随后通过双向池化排序算法提取三种图序列中的动作特征,压缩生成相应图序列的三类结构化图像,这三类结构化图像作为该视频的特征表达。在构建三个层次的结构图序列时,本文的创新点在于,将提取出的关键单元图像块进行拼接,得到基于三种关键单元拼接的三种层次的结构化运动图像,使得该图像不仅保留了时间-空间信息,也加强了深度图像的结构信息,同时降低了计算量。最后将三类结构化图像分别输入到卷积神经网络当中,将得到的判断识别结果做乘法融合获得到该动作最终的识别率。本文提出的方法不仅保留动作序列的局部和全局的时间-空间-结构信息,也利用卷积神经网络提取特征的优势,加速了动作识别的处理速度,为动作识别提供了新的思路。该方法在五个国际上通用的动作数据集,分别是微软研究院的MSRAction3D数据集,G3D数据集,MSRDailyActivity3D数据集,中山大学的SYSU 3D HOI数据集和佛罗里达大学UTD-MHAD数据集上进行了验证,并取得了较好的实验结果。
其他文献
客观来说,声乐演出,特别是仅以一架钢琴作为伴奏乐器,演出形式极简的独唱音乐会,是无法与世界一流交响乐团或“大场面、大制作”相比的,普通观众对于两者所带来的感染力的期
<正> 上海橡胶制品研究所研制的D17单组分硅橡胶粘合剂系由一种反应性的室温硫化硅橡胶、增强剂、交联剂和催化剂组成,具有强度高、无腐
顺应我国经济、政治和社会的发展,政府必然从经济上的建设型政府、管理上的管制型政府向以公共管理为主的服务型政府转型。城乡规划作为政府的一项重要公共政策,一直是以主动、
本文介绍了目前网络教学的现状,分析了网络教学存在的问题,最后提出了解决问题的对策和措施。
本文围绕当前农村初中美术教育现状,指出造成农村初中学生审美素养偏低的原因。同时,提出提高农村初中审美教育的途径。
急性中耳炎是耳鼻喉科常见疾病,指48h内突然发生的中耳急性炎性反应,可伴中耳积液([1])。儿童急性中耳炎,无论是化脓性或非化脓性,在疾病的早期,两者的临床表现相似,目前不少学
试验旨在研究日粮添加异麦芽寡糖对断奶仔猪生长性能、抗氧化和免疫性能及肠道微生物含量的影响。选择健康、体重一致的(28&#177;1)d杜洛克&#215;长白&#215;大白断奶仔猪600头,
基于2013年湖北省4个县(市)的农户调研数据,采用迭代三阶段最小二乘法(3SLS)估计了农村劳动力外出务工对农户家庭经营收入的影响。结果表明,农户的农业生产收入因劳动力外出务工
两岸金融合作法制肇始于2009年签署的《两岸金融合作协议》,随后签署了海峡两岸银行、保险、证券期货三项金融监督管理合作谅解备忘录(简称MOU)。2010年签署的《海峡两岸经济
本文制作了3根钢筋混凝土方柱试件,其中1根用作对比柱,另外2根分别用镀锌钢丝网砂浆和不锈钢钢丝网砂浆加固,进行在竖向恒定轴力和水平低周往复加载作用下的对比试验研究,测