静态图像人体轮廓提取方法的研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:yangdod
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
静态图像人体轮廓提取是指从静态图像中将人体轮廓分割出来,它在计算机视觉中的人体行为识别、背景分割与替换等多个方面都有着广泛的应用。静态图像人体轮廓提取面临着巨大的挑战,包括人体姿态的多样性,衣着的各异性,光线的变化以及复杂的背景等多个方面。近年来,随着深度学习的快速发展,图像处理领域中基于传统特征提取的方法逐渐被深度学习所取代,而卷积神经网络在图像特征提取方面体现出了很大的优势。因此,采用卷积神经网络进行人体轮廓提取具有重要意义。本文的主要研究内容如下:1.针对传统特征提取无法精准分割人体轮廓的问题,采用一种基于深度学习的人体轮廓提取方法。该方法设计了特定的卷积神经网络结构,在模型中引入了全卷积神经网络,反卷积与网络中网络的相关技术,实现了对静态图像在像素级别的人体轮廓提取。2.为了提高模型的性能,在本文所构建卷积神经网络的基础上提出了一种改进方法,将原始图像经过Gabor滤波器进行预处理后再传入卷积神经网络,利用Gabor特征与卷积神经网络相结合实现了更精确的人体轮廓提取。3.分别借助VOC2012数据集和百度人体分割数据集来验证本文所提出方法的有效性。并将改进后的模型应用于具有隐私保护功能的视频监控系统,选择CAVIAR视频监控数据集中的视频进行测试,并对结果进行分析。实验结果表明:(1)基于卷积神经网络的人体轮廓提取方法实现了对人体轮廓的快速有效分割,体现了利用深度学习进行实验的可行性;(2)改进后的模型在VOC2012数据集上的吻合度测试结果比原始模型提高了 10.96%;(3)在百度数据集上的测试结果表明该改进方法相比于其他现有方法,在准确度和处理速度等方面都能体现出合理性和有效性;(4)该改进方法在CAVIAR数据集上的测试结果为精准度和同步性要求较高的视频监控应用提供了理论基础和改进方向。
其他文献
扩频通信具有良好的保密性和抗干扰能力,在现代通信系统中得到了广泛的应用,而以混沌为基础的扩频通信技术在近年也得到了广泛的研究。混沌动力学的发现为扩频序列研究提供了
阵列合成孔径雷达(Synthetic Aperture Radar, SAR)三维成像系统是一种新体制SAR系统。其一般采用波束下视工作方式,在切航迹方向放置阵列天线,结合载荷平台的直线运动,合成
多输入多输出(MIMO)系统是近十年来现代数字通信领域最重大的技术突破之一。该技术催生了许多先进通信技术,被认为是解决未来无线通信领域信道容量和频谱传输速率的的关键技
基于现场总线技术构建的矿山安全监控系统网络,数据信息一般在本地网络内进行传递,并不能直接和外部网络进行通信,信息无法直接与管理层垂直集成。如果要实现现场设备直接与
作为绝缘材料的SF6气体在高压、超高压断路器中得到了广泛的应用。由于SF6既是一种很强的温室气体,又比空气的密度大,如果发生泄漏对环境会产生严重的影响,同时威胁操作人员
认知无线电(Cognitive Radio, CR)是一种随着无线通信发展的不断需求而产生的新技术。美国联邦通信委员会的调查研究显示,许多由当今固定频谱分配政策确定的频谱段,在大部分
作为未来移动通信系统的发展方向和技术标准,IMT-Advanced系统的候选无线接入技术将向多载波,多天线和协作式传输技术的方向发展。为保证IMT-Advanced候选技术方案评估的有效
无线通信技术的成熟和发展,促进了新型无线业务的出现,越来越多的应用都需要自动定位服务。为了解决自动定位的问题,基于卫星通信的全球定位系统(GPS)出现了,其良好的定位精度解
电站锅炉炉膛内的燃烧状况,直接影响到电站的安全性和稳定运行,对锅炉炉膛燃烧状态的判断主要方法是依靠检测炉膛内燃烧器火焰的状态。传统的火焰检测方法,通常是对火焰进行
随着社会的发展,人们对高质量图像的需求越来越来强烈,对光学成像系统采集图片的清晰程度也提出了更严格的要求。在实际的生产生活中,图像作为真实世界中三维场景在二维平面