【摘 要】
:
人体姿态估计是指定位图片中人体中头、肩、肘、腕、髋关节、膝盖等关键点的技术,可用于人机交互、运动分析和动作识别等领域。相比传统的姿态估计算法,卷积神经网络的方法在
论文部分内容阅读
人体姿态估计是指定位图片中人体中头、肩、肘、腕、髋关节、膝盖等关键点的技术,可用于人机交互、运动分析和动作识别等领域。相比传统的姿态估计算法,卷积神经网络的方法在人体姿态估计方面取得突破性进展,使姿态估计的准确性和泛化性大大提高。现代的姿态估计普遍采用卷积神经网络回归热图的方式定位人体的关键点,本文针对热图回归中关键点的检测精度和卷积神经网络的效率问题做了研究并分别提出了对应的算法模型。论文的主要贡献如下:(1)提出一种多尺度中间监督卷积网络的人体姿态估计算法。现有算法使用单一尺度热图标注非单一尺寸的关键点,作为CNN模型的监督信息,这种监督方式会导致预测关键点偏离真实位置的可能性增大。为了提高预测准确度,本文方法首先通过控制改变二维高斯分布的标准差在关键点上分别生成大尺寸、中尺寸、小尺寸的热图标注,利用Res Net50作为骨干网络,组成三个阶段的残差网络模型,第一、二、三阶段Res Net50的热图输出分别对应大、中、小尺寸的热图标注,在第一、二阶段的输出实现两次的中间监督;在测试阶段使用最后阶段的热图输出,进行非极大值抑制选择热图中心的作为最后的关键点坐标。结果在COCO和MPII这两个常用人体姿态估计数据集上进行验证。在MPII验证数据集上的测试结果PCK@0.1达到37.2%,相比Resnet152提高了2.1%,PCKh达到89.94%;在COCO验证数据集上测试的结果m AP达到75.5%,相比其他方法提高了1.2%,在AP.5、AP.75、AP(M)、AP(L)、AR五个项目中取得0.5%~1.5%的领先。结论本文提出的多尺度中间监督卷积网络模型,减少因关键点尺寸与热图尺寸不对应在姿态估计中的影响,从而提高了姿态估计的准确了,在评价标准更严格时取得更好的表现。(2)提出一种高效的人体姿态卷积网络。现有的人体姿态估计方法往往只考虑如何提高模型的泛化性能,通常会增加模型的参数来获得大的模型,大幅增加网络模型的大小,也的确带来了准确率的提高,而忽略了显著的效率问题,准确率的提升带来大幅度增加的计算量和冗余的参数,使得模型的运算时间变长,显得效率较低。本文使用Efficientnet作为姿态估计模型的骨干网络,有效提高了姿态估计的效率;分别研究了两种用于处理特征输出、回归热图的子网络,得到M0和M0*两种模型,进一步提高了模型的效率;研究了基准姿态估计模型中,分别在网络的深度、宽度、分辨率三个维度进行扩大的效率,发现持续增加单一维度的网络模型、准确率会迅速饱和,使网络的收益降低,本文使用复合扩大的方法,在网络的三个模型进行同时扩大,每次增大后模型的运算量增加1.5倍到2倍。在获得的准确率相同的情况下,本文方法的参数量和运算量都远远小于与近两年的方法。
其他文献
由于Hadoop MapReduce等大数据处理平台的处理性能一直在不断提升,使得大数据处理成为了IT业界内最受关注的领域。在这些大数据处理平台中,Spark框架从被提出来之后变得越来越流行。相对于传统的Hadoop MapReduce编程模型的key-value编程,Spark的编程模型中提供了更多对于集合操作的支持使得Spark编程本身更容易学习使用。由于Spark的是一个完全在内存中计算的框
近年来,为贯彻国家建设资源节约型社会和绿色环保发展战略,能够避免因二次装修造成资源浪费的成品住宅得到了快速发展。在此背景下,通过调研和参考国内外相关成果,经过理论与
云辅助无线传感器网络是当下一种非常流行的应用模型,是云计算与物联网高度融合的一种具体表现。在云辅助无线传感器网络场景中,数据的隐私保护是重中之重。传感器采集的数据多为个人的隐私数据或企业和国家的机要数据,而无论是公有云或私有云,本身都面临着诸多安全威胁。因此,这些数据从采集到存储,再到访问和处理,需要全方位地安全保护。可搜索公钥加密是一种能为外包云数据提供安全存储和搜索功能的密码手段,是云数据安全
红外行人跟踪在夜间自动驾驶和军事侦察等领域具有重要意义。红外视频与普通彩色视频相比易受周围环境的影响,目标的纹理特征和灰度分布常有较大幅度变化,进而导致跟踪困难,
工业机器人编程对机器人在工业中的实际应用以及工作效率的提高有着重要的意义。目前,绝大多数工业机器人的运动轨迹都是采用人工示教的方式进行编程,实现控制机器人的运动轨
得益于通信技术的快速发展,网络接入速度不断提升,随之出现了许多新兴的业务应用。近年来不断涌现的物联网、虚拟现实、无人驾驶等新型应用,使得用户对通信速率的需求大幅增加。光纤通信系统以其大容量、低损耗的固有优势,成为现代通信系统中不可或缺的重要环节,以光纤为传输媒介的移动前传网络在无线接入网络中负责连接基带单元和远端天线单元,在即将到来的5G中也扮演着重要承载角色。基于模拟信号传输的移动前传系统具有频
量子信息科学试图利用量子层面的能力来实现在经典层面不可能实现的任务。量子信息科学已经为实现量子计算和量子通信所需的物理资源奠定了充分的条件,但是人们对量子测量,并
当前云计算和云平台应用不断普及,很多用户在云端存储数据。鉴于云端非可信性,为确保敏感数据的安全,用户通常进行加密数据云存储,但是这样丧失了数据的可用性,完全同态加密算法的出现能够实现在加密数据上的搜索和计算等操作。另外针对云服务提供商返回结果的不确定性,有必要对相关返回结果进行验证,保证结果的有效可用性,从而促进云计算的良好发展。对基于环上错误学习问题的一种完全同态加密算法进行分析,提出数字提取部
随着新兴信息技术的发展,激发了新一轮工业革命,工业物联网的兴起催生了如个性化定制生产模式等新型制造模式和服务。工业物联网需要集计算、通信、控制于一体,包含环境感知
生物化学传感器在国土安全、医学环境监测、生物科学研究以及食品安全领域具有重要应用。目前,场效应晶体管生物传感器具有易集成化、检测快捷、反馈信号易处理等优点,广泛的