基于深度学习的人体特征点定位算法研究

来源 :南京信息工程大学 | 被引量 : 1次 | 上传用户:horse12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体特征点定位算法是计算机视觉领域中一个非常重要的分支,在人机交互、影音娱乐、美颜相机中具有广泛应用场景。本文研究的人体特征点包括人脸特征点和人体关节点。为了让人体特征点在计算资源有限的设备上准确快速的定位,本文提出了两种基于深度学习的人体特征点定位算法。首先在人脸特征点定位算法中,本文提出基于Inception结构的卷积神经网络代替多级联神经网络结构,有效降低了运算量;为了提升网络的准确率,使用多分支结构增加网络宽度,并引入了残差结构,进而实现人脸特征点的快速准确定位。其次在人体姿态估计算法中,本文将深度可分离卷积与沙漏型网络结构相结合,这种组合方式能够极大降低网络的参数量,从而提升人体姿态估计的速度。为了减少空间信息的损失,本文使用热力图作为神经网络的输出,这种结构能够有效提升定位的精度。为提高人脸特征点的定位速度,本文提出一种基于Inception结构的特征点定位方法。该方法取消了传统的多级联结构,采用一个更宽更深的神经网络实现人脸特征点的定位,从而大大提升神经网络的运算速度。为了弥补单个神经网络带来的误差问题,本文设计出一种基于Inception结构的模块。该模块首先使用多个卷积分支对特征图进行卷积操作,然后将多个分支的特征图进行叠加,最后引入残差结构以减少网络梯度弥散现象。改进后的Inception模块对图像的平移、缩放、变形等具有更好的识别性,增加了网络的适应性。经实验证明,该算法在保证特征点定位准确性的同时,对定位速度有一定提升,面对不同姿态和不同环境的人脸时该算法均实现了稳定的定位,具有较高的鲁棒性。为提高人体姿态估计的速度,本文提出一种基于深度可分离卷积的特征点定位算法。该方法将深度可分离卷积与沙漏型网络结构相结合,从而提升网络的定位速度。深度可分离卷积的操作是通过减少网络参数的方式提升定位的速度。沙漏型网络结构通过对特征图分辨率的压缩再上采样,有效降低了网络的运算量。该算法采用热力图作为网络的输出,保存了更多的空间信息,提高网络的泛化能力。实验结果证明,本文研究的人体姿态估计算法在准确度和运算速度上均取得了令人满意的成绩,在不同姿态和环境中具有较高的鲁棒性。
其他文献
针对传统BP网络训练算法难以解决离散域值空间寻优的问题,以及原有神经网络权值的整型优化方法存在的不足,提出一种利用改进的遗传算法(Improved Genetic Algorithm,IGA)对神经网络进行整型权值学习优化的方法,以提高神经网络在嵌入式实时系统中的运行效率,并且大大地减少系统的存储容量,扩大神经网络的应用范围。仿真实验结果表明,新的整形权值神经网络训练方法在收敛效率、逼近精度和泛化
由于传统监测系统受制地形,天气,人文等诸多条件限制,无法保证监测的时效性;之前监测数据没有与地质、岩土、数学等学科进行综合分析,数据挖掘不够深入,造成了数据浪费。因此
目的分析寻常型银屑病(psoriasis vulgaris,PV)患者中Th17细胞、CD4^+、CD25^+调节性T细胞表达水平及临床意义。方法选取2017年6月至2018年6月收治的64例PV患者为PV组,另选取
随着我国火灾事故的高发,注册消防工程师的考试实施,国家亟须一些具有消防知识的人才。《消防工程学》是安全工程专业和消防工程专业的核心课程之一,本文就目前我校该课程授
以CNKI数据库中关于数字图书馆和知识产权研究的历年文献为研究对象,运用SATI、UCINET软件的聚类分析绘制该领域的知识图谱,探索其热点、前沿和发展趋势,对了解数字图书馆与
辛亥革命时期是中国传统女性伦理转向的一个重要时期。在这一时期,中国传统女性伦理开始了以反对封建纲常伦理的束缚、追求人格独立为主线的嬗变,具体表现为:批判封建家族制度,呼