基于卷积神经网络的多人姿态估计

来源 :郑州大学 | 被引量 : 0次 | 上传用户:hutao95
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体姿态估计是计算机视觉领域中的一个重要研究方向,用来实现从图像或视频中检测人体若干关键点位置,以帮助机器更好地解读人的行为。人体姿态估计是人机交互、人体动作识别、行人再识别等后续任务的基础,在自动驾驶、体感游戏、视频监控、体育训练、辅助医疗等领域都有着重要的应用价值。随着深度学习的不断发展,深度神经网络在计算机视觉中的图像分类、语义分割、目标检测等许多子领域均取得了突破性的进展,越来越多的研究者将深度神经网络应用于人体姿态估计。本文针对静态图片和视频中的多人姿态估计方法中存在的问题,对已有卷积神经网络算法模型进行研究和改进,分别提出基于双向加权融合的多人姿态估计方法和基于深度可分离卷积的快速多人姿态估计方法,主要工作包括:(1)在静态图片中的多人姿态估计方面,提出一种基于双向加权融合的多人姿态估计方法。本文针对已有级联金字塔网络(Cascaded Pyramid Network,CPN)模型对特征图利用不充分、估计性能不高的问题,提出一种基于双向加权融合的多人姿态估计方法。该方法相对于CPN模型的主要改进包括:一是使用双向加权特征金字塔网络改进Global Net,使特征金字塔中不同尺度的特征图按照不同比例进行融合,并且特征金字塔除了原有的从上到下的连接方式,又加入了从下到上的连接方式,从而使不同尺度的特征图被有效利用;二是把Dense Net中的网络连接方式加入到Refine Net,使特征图每经过一层卷积得到的新特征图与原输入特征图进行拼接而非相加,这样经过多个卷积层后特征图能够被多次重复利用,可以增加特征的多样性,使网络模型能够学习到更多的信息,从而使估计精度得到有效提高。(2)在视频中的多人姿态估计方面,提出一种基于深度可分离卷积结构的改进Open Pose模型。由于传统Open Pose模型依赖的卷积神经网络具有较高运算复杂度,因此模型的训练和部署需要配备有高性能GPU板卡的服务器才能完成,无法在使用嵌入式设备的边缘计算场合投入实际应用。针对此问题,本文用深度可分离卷积结构代替Open Pose模型中传统卷积结构,并对Open Pose模型中重复级联的阶段数进行修改,从而提出一种基于深度可分离卷积结构的改进Open Pose模型,在保持估计精度和原Open Pose模型相当的条件下极大降低Open Pose模型的运算量,从而使改进模型能够在具有较少运算资源的嵌入式终端上实现实时运行,支持边缘计算场景下实时人体姿态估计的应用。
其他文献
我国经济步入新常态以来,已由高速增长阶段转向高质量发展阶段,正处在转变发展方式、优化经济结构、转换增长动力的战略攻关期,经济增长动力亟需由依靠要素投入扩张转变为依
互联网众筹打破了传统的融资模式,依托互联网平台,为拥有创新创业想法的小微企业和个人提供了融资渠道。2001年,美国音乐类众筹网站Artist Share成立,标志着现代互联网众筹的
维州企业家江苏驻点交流项目是维多利亚工商会与江苏省工商联之间基于友谊的商业交流项目,报告人于2018年5月20日至26日作为讲座口译及联络口译分别参与到讲座培训及实地考察
改革开放四十多年来,我国经济保持了持续的快速增长,堪称人类历史上前所未有的发展奇迹。但是,伴随着经济的快速增长,我国的能源消耗也开始急剧上升,最终导致我国对境外能源的依赖程度日益加重以及生态环境的日趋恶化。在此大背景下,准确评估我国各省的能源效率及其影响因素,不仅可以了解我国省际能源效率的差异,发现各省在能源效率上的改善空间,还可以提出针对性的建议,对我国保持经济的可持续增长有极其重要的意义。本文
区片综合地价的确定对进一步规范和完善征地补偿制度,确定公平合理的征地补偿办法,进一步保障农民的合法权益,保持社会经济可持续发展具有意义重大。本文借助Arc GIS地理信息
作为经典随机游荡的量子类似物,量子随机游荡属于量子概率论的研究范畴,并且在量子信息、量子计算及其他领域中都有着广泛的应用.量子Bernoulli噪声是定义在平方可积Bernoull
在自然界中,动物所需的食物资源会随生境的变化而发生一定的改变,与此同时,不同种类的动物具有一系列的生存机制以适应复杂多变的环境,其中小型哺乳动物在应对食物资源短缺时
随着以深度神经网络为代表的人工智能技术的快速发展,司法领域正在向智能化、自动化方向迈进。作为司法审判中的重要环节,罪名预测任务直接关系到整个案件的裁决与性质。目前
本文讨论一类宿主-大寄生虫扩散模型的稳定性、Hopf分支及扩散导致的Turing不稳定性.首先,讨论相应的常微分方程模型非负平衡点的局部稳定性,Hopf分支的存在性,方向及稳定性.
课堂口译具有即席性、互动性、不确定性等特点,是口译的重要形式之一。电力行业课堂口译作为科技口译的重要分支,涉及领域广、专业度强,因而难度较大,对译员素质要求较高。报