基于改进沙漏网络和分布感知坐标表示法的人体姿态估计

来源 :吉林大学 | 被引量 : 0次 | 上传用户:Cary1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体姿态估计作为行为分析以及动作识别的重要技术,在计算机视觉中具有非常广阔的应用前景。近年来,虽然深度学习在一定程度上极大地促进了人体姿态估计相关工作的进步,但如何将人体模型更好的融合到卷积神经网络中,如何在保证高精度的同时提高网络的处理速度,如何对人体姿态的先验知识实现更充分的利用仍然具有特别重要的研究意义。因此本文以基于深度学习的姿态估计算法为主要研究内容,旨在设计出一种更高效,更准确的姿态估计网络模型,用于进行人体关键点的标定。本文的主要工作以及创新点如下:1.本文在总结研究了现有技术的基础上,对传统的沙漏网络进行了改进,提出了Refine Hourglass模型。首先本文对沙漏网络中相邻阶段的特征进行了融合,从而使得当前阶段的网络能够对先验信息实现充分利用,以增强图像特征在级联网络中的传播能力。另一方面,本文使用多尺度残差块对原网络的特征提取模块Residual block进行替换,从而对不同尺度的特征进行融合,增强网络结构对不同图像特征的适应性。最后,在降采样分辨率下降的同时,我们适当增加通道数,从而在下采样过程中提取更多具有代表性的特征。2.有研究表明,将模型预测的heatmap转换为原图中的人体关键点坐标,这一过程对于关键点检测任务的性能提升有着非常重要的研究意义,而原沙漏网络的坐标编码和解码过程容易引入量化误差,在设计上具有一定的缺陷。为了进一步对模型进行优化,本文引入基于分布感知的坐标表示法来对沙漏网络中的坐标编码和解码过程进行改进,从而使得坐标和热图之间的转换工作能够更加精确的完成。3.原沙漏网络只在MPII数据集上进行了单人姿态估计效果的验证,本文采用自顶向下的检测思路,引入人体检测器PP-YOLO结合我们提出的模型完成在COCO数据集上的多人人体姿态估计。4.最后,我们分别在MPII数据集和COCO数据集上对本文所提出的算法进行定量评估,并与其他经典人体姿态估计算法进行对比。其中,在MPII测试集上,我们的模型总体上对比原网络提高了1.4个百分比,尤其是肘部和手腕两个点分别提高了1.8%和1.9%。在COCO测试集上,算法准确率达到了76.0AP,实验充分验证了本文所提出的算法的有效性。
其他文献
停车位智能服务平台的运行过程中,各通信角色之间,特别是客户与停车场管理员之间、平台内部各节点之间会持续进行数据传输,此时若不对信息进行保密防护,会导致用户个人信息、支付数据以及账户口令暴露于开放的互联网空间,中间人通过技术手段可窃取私密信息,导致用户财产损失及信息失窃。要想保证平台的安全顺利运行,通信数据的安全是必须要考虑的重要技术问题。为保护平台通信中的信息安全,最可靠、最可行的手段是应用现代密
当前的汽车行业中,电动汽车已经渐渐成为研究的主要方向,然而目前市场上的动力电池,因为其充放电特性,能量密度,快充等技术条件的限制,一直在制约电动汽车的发展。在电动汽车的解决方案中,增程车的发动机工作特性好,排放性能优越,续航里程场长,使用成本低,是电动汽车的中间方案中一个比较好的选择。其中比较重要的部件是增程器(Auxiliary Power Unit,APU),动力电池以及驱动电机。而其中的动力
道路条件的环境感知是汽车自动驾驶技术的重要环节,提前获得的道路条件信息,能够为自动驾驶车辆在行驶过程中的启动、转向和停止等操作实时提供操作判别依据。本文以非结构化道路为研究对象,探究其道路区域检测及路面类型识别算法,为车辆提供可靠精准的输入信息,从而实现车辆在非结构化道路行驶的精确控制。对非结构化道路区域检测和类型识别的研究主要基于视觉信息方法进行,需要在汽车上安装相机或摄像头等传感器。本文依托于
背景:间充质干细胞是再生医学中的理想候选者,目前其临床应用受限于由移植微环境改变导致的细胞存活率降低和旁分泌能力差。预处理策略被认为可以最大限度地提高间充质干细胞在移植微环境的存活率和生物学作用,为严重烧伤的治疗提供新思路和潜力。目的:对间充质干细胞预处理策略在严重烧伤治疗中的潜力进行综述。方法:以“间充质干细胞,严重烧伤,间充质干细胞预处理,烧伤病理生理学,严重烧伤”和“mesenchymal
近年的高考物理电学实验中,以定值电阻为背景的设计性试题层出不穷。定值电阻在电学实验中的作用灵活多变,但很多学生不知道定值电阻的作用和其对电路的影响,故对它的选用感到无从下手。鉴于此,本文结合往届高考试题,对电学实验中定值电阻的主要用途进行简单小结。
无人驾驶技术在计算机技术和人工智能技术快速发展的推动下,正在全球掀起热潮,众多科技公司、整车厂和高校都在积极探索无人驾驶技术。无人驾驶技术不仅能够给人类的日常生活带来极大的便利,同时能够在生态保护、安全交通、缓解城市交通压力等方面提供完美的解决方案。无人驾驶的实现需要传感技术、定位技术、融合预测技术、决策规划技术、线控技术等协调发展。为实现汽车的无人驾驶,一个重要的亟待解决的关键技术便是自主换道技
随着自动驾驶的研究逐步走向实用化,人们对自动驾驶准确性与安全性的要求也越来越高。自动驾驶系统是一个高度自治的系统,包括感知模块,路径规划模块,行为决策模块和自适应控制模块,其中行为决策模块是确定自动驾驶汽车安全性和稳定性的关键技术。现有的主要决策算法可以分为三类:基于规则的方法,强化学习方法和深度学习方法。基于规则的方法对于简单场景的准确性很高,但是规则制定方法的复杂性限制了它在复杂环境中的进一步
根据中国癌症中心发布的报告,脑癌是发病率第二高的儿童癌症,也是15-34岁成年人癌症死亡的第三常见原因。脑癌的治愈率并没有随着科技的进步而提升,只有及时发现并及早治疗才能有效提升患者的治愈率与存活时间。随着医疗影像技术的进步和推广,核磁共振技术(MRI)成为了脑癌的主要诊断方法,该技术可以帮助医生在不通过外科手术的情况下诊断出脑癌。但医疗影像的判读需要医生拥有丰富的临床经验,同时筛查细节较多的脑部
远监督关系抽取任务通过将知识库中的关系事实与语料库对齐自动产生训练数据,有效地减少了手工标记数据的成本,并且被广泛地应用在大型语料库中以查找新的关系事实。然而该方法在自动生成训练数据的同时却不可避免地引进了大量的噪声数据,这对于模型的训练很不利。在这里我们利用互信息分别从句子级和单词级进行降噪,以解决此问题。我们的方法均是通过有效句子间的互信息实现,而该信息的获取主要基于“有效句子间是存在联系的,
多细胞生物依赖多种分化的细胞密切合作,共同完成复杂的生命活动。通过对单个细胞和细胞间的相互作用分析来揭示生物体内的活动,可以达到对细胞间差异的发现和对疾病进行精准治疗的目标。在对细胞中蕴含的信息进行研究时,会采用不同的技术进行研究与分析。随着单细胞研究投入的增加,单细胞相关技术大量涌现,积累了大量相关数据。然而,研究者们难以从海量的数据中获得有效的信息,提出快速高效的机器学习算法对单细胞相关技术的