基于相关性约束学习的人体姿态估计

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:xiaozhi_1100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2D人体姿态估计的研究目标是准确检测并定位图片中人体的所有关键点,例如,膝盖,脚踝等,是当前计算机视觉领域的一个研究热点。近年来,尽管基于深度学习的人体姿态估计模型取得了较大进展,但大多数工作均聚焦于人体关键点的检测,忽视了肢体之间的关联。鉴于人体物理结构的整体性质,本文从关键点的相关性来建模学习人体姿态估计特征,主要研究工作如下:(1)提出基于期望最大化的人体姿态估计网络(Expectation Maximization pose Network,EMpose Net)。人体姿态估计可以看作一个同性质的多任务学习问题,每个任务对应于检测不同关键点,因此相关性弱的任务之间共享特征信息会出现负迁移现象。为了缓解负迁移的影响,本文将人体的所有关键点分成若干组,每组内的关键点具有较强的相关性,从贝叶斯的角度将相关的关键点视为隐变量,设计EMpose Net学习并预测关键点的位置,提高人体姿态估计的结果。与当前大多的特征学习方法相比,EMpose Net提升了网络特征表达能力,也避免了网络在优化时收敛到局部极值。在COCO数据集和MPII数据集上的实验表明,EMpose Net具有较好的性能。(2)提出基于因果干预的人体姿态估计网络(Causal Intervention pose Network,CIpose Net)。由于人体关键点之间存在相关性,基于此,本文从因果分析的角度建模关键点之间的约束关系,提出CIpose Net。首先,本文基于人体结构的整体性建立姿态概率图,并通过后门调整准则人体姿态概率图进行干预,学习关键点之间的概率约束。在常用数据库上的实验结果表明,CIpose Net可以较好建模关键点之间的依赖关系。
其他文献
由于成像系统及环境设备的缺点,图像不可避免会在采集、传输和存储等过程中受到污染导致质量下降。因此,图像复原是数字图像处理研究领域中的一项最基础的任务之一,并且它在后续图像的处理与应用中扮演着十分重要的角色。传统全变分在复原图像时因具有很好保存图像边缘信息的优点,被广泛应用于图像复原问题中。然而,由于全变分模型假设图像是分段光滑的,所以在复原过程中容易产生阶梯效应。为了进一步提高图像复原的质量,本文
随着智能手机等智能终端的普及,原来面向高性能配置服务器硬件上的图像处理和深度网络手写识别方法表现优秀,但是由于计算量太大,很难直接推广应用到存储和计算资源都有限的智能终端硬件上。为解决图像处理和深度网络计算量过大的问题,本文重点研究了面向智能终端的图像快速处理和轻量级深度网络手写识别方法。首先,为了加快智能终端上的图像处理速度,采用了图像快速压缩,图像灰度化增强,高斯滤波加权平均去噪,迭代最佳二值
冰雹灾害每年都会给人民以及国家带来巨大的经济损失,所以准确的识别冰雹灾害对人民财产以及国家设施的保护起着重要的作用。目前,研究学者大多通过对冰雹云的多普勒雷达回波进行分析,从而实现冰雹灾害的预警与识别,但是识别结果还会存在一定的误差。本文提出从图像的角度出发,对降落的冰雹进行检测,将图像处理技术作为雷达检测的后验方法,进一步提高雷达预测识别的精准性。本文对图像检测算法中存在的热点、难点进行了重点的
目标跟踪是计算机视觉领域里的一个研究热点,并广泛应用于视频监控、交通、人机交互等生活领域中。近年来,跟踪算法的性能不断提升,但是在面临复杂场景时,设计一个高鲁棒性的跟踪模型仍然是个难题。针对传统跟踪算法存在的不足,本文在相关滤波框架的基础上进行了以下一些研究:针对传统相关滤波跟踪方法的空间正则化权重与目标内容无关和跟踪过程中模型发生退化等问题,提出一种基于时间感知和自适应空间正则化的目标跟踪算法。
随着社会电子产品需求量的剧增,对于PCB焊接流程工艺的要求不断提高,但是PCB焊接流程中的定位支撑工作仍然需要人工完成,这样既增加了人工成本,又提高了人为误差风险,针对此问题本文提出了基于机器视觉的PCB板定位支撑系统的课题,致力于用机械取代人工。首先,本文介绍了选题的意义及目的,阐述了机器视觉的国内外发展现状。针对PCB板的识别定位系统设计问题,设计了总体系统的软硬件。其次,为了解决系统中视觉标
人脸年龄合成是研究某个人过去和未来相貌的一门技术,这项技术在现实生活中有很广泛的应用,例如寻找失踪人口,影视娱乐,公益项目宣传等。但众所周知,人脸图片中包含很多重要信息,如:性别、表情、身份、年龄等,如何获取这些信息以及如何保留更多的有效个人面部信息,使生成的图片更像本人值得深入研究。此外,由于数据稀缺,人脸年龄合成领域的研究始终面临巨大的挑战,如何解决数据稀缺的问题也值得深入探讨。针对上述问题,
协同目标分割是一种对多张相关图片中的共同类别物体进行分割的技术,其着眼于多张图片中的共性特征,挖掘同类别图像间的共同模式,在计算机视觉领域有着广泛的应用场景。传统方法大多根据图像的明暗、色彩或者手工设计的边缘特征对不同的区域聚类,受制于有限的特征表示能力,在图像模糊、不均匀光照等复杂场景下难以实现正确分割。近年来深度学习的兴起,基于卷积神经网络的算法凭借海量数据和强大的特征表示能力,在性能上大幅领
上世纪60年代兴起的气象卫星是气象探测研究和业务中的重要突破,其提供的连续的高时空分辨率云图数据是以往常规探测技术无法比拟的。卫星云图可以作为日常天气分析和预报辅助工具,对于卫星云图的解译和使用,是天气预报工作不可分割的组成部分。当前气象卫星云图研究和应用中目视判读仍是主要手段之一,主观因素导致无法完全提取和最大化利用卫星云图中的有效信息,并且妨碍了定量化和自动化预报的发展。随着国产气象卫星技术的
随着大数据时代的到来,图像、视频等大量高维数据在获取、存储的过程中,不可避免地出现获取的数据是残缺不全的、含有大量噪声等现象,这会使数据的分析受到极大的影响,如何将残缺的数据补全或者从噪声中恢复干净的数据成为了数据处理的重要问题。近年来,低秩模型引起了学术界的广泛关注。由于图像、视频等高维数据的内部结构、前后帧之间往往有较强的相关性,可以在低维空间对其进行表示,因此基于低秩学习的张量补全和恢复的模
腺癌是一种常发生于上皮腺体组织的癌症类型,在结直肠癌、前列腺癌、乳腺癌、肺癌等多种恶性肿瘤中都十分常见。在病理形态上,腺癌的发生往往伴随着腺体结构分化变差甚至不分化,即腺体组织呈现出异常变形扭曲、内部空腔结构被细胞核侵占致其缩小甚至消失。这种不同程度的腺体分化直接与腺癌的恶性程度相关联。因此,在临床病理诊断中,腺体组织结构的分化程度是病理学家确定腺癌等级乃至决策治疗方案的决定性因素。为了实现腺癌恶