基于人体姿态估计的服饰关键点定位技术研究与应用

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:liqwart2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体姿态估计是计算机视觉领域的方向之一,通过对人体的骨骼关节点进行定位,可用于行为识别、人机交互、自动驾驶等。因现实场景中常包含多个人体,主流的解决方案是首先通过目标检测确定每个人的大致位置后,再进行单人姿态估计。视觉时尚是近些年的新兴领域,由于人们对服饰理解的差异和个人主观性的影响,造成了消费者和商家间的沟通障碍,利用人工智能使机器“理解”时尚,建立统一的服饰专业知识标准,可改善顾客的购物体验。本文首先完成了对课题数据的预处理、数据集划分、多任务标签生成和数据增强等前期工作,并提出了应用于多/单服饰关键点定位任务的网络模型,主要工作分为以下两个方面:(1)基于Mask-RCNN的网络架构,本文提出了多任务学习网络,分别完成多服饰检测和关键点定位。改进主要体现在三个部分:使用DenseNet进行特征提取,并利用特征金字塔完成融合,之后对P2-P5各尺度特征进行拼接,用以丰富上下文信息;在mask分支全卷积网络的解码部分,将卷积最后各层都通过反卷积的方式融合起来,保留更多的细节信息,有助于提升定位能力;使用高斯热度图代替二值Mask作为训练标签,增加各点上的监督信息。经实验验证,相比于Mask-RCNN基线模型,本网络在IOU和NE分数上分别取得了16.4%和28.4%的相对提升,IOU分数达到90.2%,NE误差降低到4.21%,预测速度约10张/秒。(2)结合人体姿态估计技术,本文设计了单服饰关键点定位网络。该模型分为三个模块:特征学习模块采用全局网络(H1)和沙漏网络(H2)级联的方式提升特征抽取能力,其中H1引入迁移学习初始化参数,H2使用空洞卷积代替下采样,有效地整合多尺度特征;修正网络模块对H1和H2的各尺度信息进行融合,之后利用反卷积完成上采样学习,并将各通道特征拼接;中继监督模块将计算各阶段误差,针对热度图中有效点的稀疏问题,提出分组L2Loss将分开计算正负类别中的误差,减少类间干扰,设计Soft OHEM在损失函数中设置各关键点的权重以区分简单点和困难点,重点修正困难点。实验以级联金字塔为基线模型,经过验证,三个模块在NE分数上分别取得了13.53%、10%和7.24%的相对改进,误差降低到3.84%,预测速度达到17.7张/秒,兼顾了速度和精度,通过测试增强处理后,误差可降低到单模型3.63%。本文通过对计算机视觉相关算法的研究,提出创新性改进的网络结构,并用于解决视觉时尚领域的服饰关键点定位问题,对未来的工程落地和相关领域扩展具有很好的借鉴意义。
其他文献
2012年《刑诉法》和《刑诉法解释》颁布后,将电子数据列为单独的证据类型,2016年又颁布了《刑事电子数据规定》,这频繁地增设新规范,体现了电子数据的应用越来越广泛,我国立法者对于电子数据相关法律体系建立的愿望也越来越迫切。之所以电子数据证据在我国得到了立法机关和理论界的着重关注,是因为电子数据证据是现代社会信息科学技术发展下的新产物,是之前数千年都不曾有过的新证据类型,对于全世界都是新事物,其相
不动产登记是登记机关根据当事人的申请或根据法律规定,把不动产的自然状况、权利状况及其他依法应登记的事项记载于不动产登记簿并加以公示的行为。我国建立不动产统一登记制度,不仅可以维护不动产交易的安全,而且也是保护不动产权利人财产权益的重要举措。在不动产登记中,审查是最核心的环节。目前,我国关于不动产登记机关对登记材料进行审查时,应履行何种审查标准的问题,以及法院应怎样合理审查不动产登记机关登记行为的合
电子信息领域中电子测量是非常重要的一部分,电子信息业的快速发展肯定也离不开电子测量的支持。阻抗测量是电子测量中很重要的一部分,可靠的阻抗测量方法对提高阻抗测量的精
随着近年来中国援外培训项目的快速发展,对应的培训班课堂口译需求也急剧增加。报告人于2019年9月3日至23日在湖南省商务厅承办的“发展中国家青年创业研修班”中担任培训课
研究目的:了解北京市医养结合服务开展现状,掌握医养结合机构内入住老年人的服务需求与满意度、机构服务供给情况,分析服务供需差距,探索不断缩小服务供需差距的政策及实践建议。研究内容:一是从基本养老、医疗、护理、康复四大服务49项具体服务项目了解医养结合机构入住老年人的服务需求与满意度;二是从以上服务项目了解医养结合机构供给服务内容,服务人员一定周期内的服务人数及时间;三是分析服务供需差距;四是提出针对
水面舰船作为各国在海洋领域捍卫主权和对敌作战的主要军事力量,需要应对来自空中打击和水下武器袭击的威胁。因此,对舰船结构防护性能的要求不断提高,开展新式防护结构的设计应用已成为提升舰船生命力和结构安全性的重要途径。而国内在钢质夹层板舰船结构方面的研究还处于预研阶段,离实船应用还有一定的距离。要成功实现实船设计应用,必须开展全面系统的研究工作,充分掌握夹层板结构的力学性能、功能特点和防护性能,突破加工
1986年,法国语言学家Dan Sperber和英国语言学家Deirdre Wilson提出了关联理论。关联理论开始主要运用于语言学领域,后来Ernest-August Gutt在他的博士毕业论文中提出了关联理论可以解释翻译研究。本文的研究载体《朝花夕拾》是鲁迅的代表作之一,其中每篇散文中都有大量带有民族文化色彩的词语。论文从关联理论的角度对《朝花夕拾》中的文化负载词的翻译进行了研究,主要从原著作
研究目的了解世界卫生组织在华合作中心(World Health Organization Collaborating Centersin China,以下简称“WHO在华合作中心”)的现状及其参与“一带一路”卫生领域合作的现状,分析其内外部影响因素,针对存在的问题和挑战提出政策建议与措施,为促进WHO在华合作中心参与“一带一路”卫生领域合作,更好发挥作用提供政策建议。研究内容1.WHO在华合作中心
本文首先从生理学基础上分析驾驶员工作负荷和疲劳产生的原因及行为反应,重点以心率变异性这一生理指标分析工作负荷和疲劳的影响关系。从人机工程学的角度出发,分析了驾驶员
知识图谱目前在许多领域都已经得到了广泛的应用。基于图匹配算法的知识图谱的推理,能够为医疗诊断、舆情发现、事件推理提供良好的理论支持。知识三元组<实体-关系-实体>是知识图谱中知识最基本的构成单位,高效快速地从网络威胁情报自由文本中提取实体之间的关系,是构建网络安全知识图谱的重要基础任务。本文围绕网络安全知识图谱构建的关系抽取算法,进行了深入研究。当前基于神经网络深度学习的远程监督关系抽