基于深度学习的人脸检测算法研究

来源 :兰州理工大学 | 被引量 : 0次 | 上传用户:mengnan16
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸检测技术作为计算机图像处理和人工智能技术的一个重要分支,在模式识别、信息安全、人机交互、智能监控以及视频检索等领域有着广泛的应用前景,受到了研究学者和工程开发人员的广泛关注。  在实际应用中,遇到遮挡、姿态变化情况时,现有人脸检测算法的准确性和鲁棒性有时不能满足实际需求。本文将深度学习理论引入到人脸检测中,提出了一种基于深度学习的人脸检测算法,通过建立深度模型学习人脸各局部区域之间的相关性,以期减少遮挡和姿态变化的影响。本文主要研究工作如下:  1.结合深度学习理论,从特征提取、训练和收敛时间等角度对深度学习的三种结构及其典型模型进行了分析。研究结果说明,深度信念网络深度模型能够更好的解决深层网络训练效率问题,训练和收敛时间较短,并能够充分描述特征之间相关性的联合概率分布,更适合于模拟人脸各局部区域之间的概率相关性。其次,从分类误差和收敛性两种角度对深度信念网络的两种优化方法进行了仿真对比实验。仿真实验结果表明:在分类误差和收敛性方面,受限玻尔兹曼机优化方法均优于 BP优化方法。因此,受限玻尔兹曼机优化方法更适合于训练优化本文提出的深度模型。  2.针对人脸检测中存在的遮挡、多姿态问题,将深度学习理论引入到人脸检测中,提出了一种基于深度学习的人脸检测算法,通过建立深度模型(深度信念网络)学习人脸各局部区域之间的概率相关性,根据局部概率相关性检测人脸。该算法首先利用部分检测器检测人脸各局部区域;然后将局部区域检测结果输入到深度模型中,利用深度模型的深层非线性网络结构学习人脸各局部区域之间的概率相关性,完成人脸检测。该算法将深度学习理论与基于部分模型的思想相结合,实现人脸检测。仿真实验结果表明:在遮挡、多姿态情况下,本文算法能够保持较高的准确性,并具有较强的鲁棒性。
其他文献
移动通信技术的飞速发展使得传统的固定网络环境变得更加灵活,用户可以通过各种无线连接方法访问数据库,获得查询结果。由于移动计算环境与固定计算环境的特性差异,使传统的
随着数字视频技术的发展,图像和视频编码技术逐渐发展成为专门的学科领域——图像压缩编码。图像编码的核心技术之一是对图像数据实施变换。自从1974年印度科学家提出离散余
气候环境与人类的生存与发展息息相关,古气候环境学作为气候科学的重要分支为研究当今以及未来的气候变化提供科学依据。古气候环境科技资源数量巨大,且各研究机构采用的数据
网格(Grid)作为继Internet和Web之后的第三次信息技术浪潮在全球范围内获得了广泛的关注。随着网格技术的发展和应用,网格已逐步渗透到企业中使用。在面向服务的企业网格中,
随着人们需求的提升和多媒体技术的进步,电影产业逐步向数字化方向迈进。而传统的JPEG等压缩技术无法满足数字电影的要求。在这种背景下,新一代静止图象压缩标准JPEG2000便应
广电数字化时代的来临给广电运营商运营支撑和管理工作带来了极大的挑战。当前还处于模拟电视时代的运营支撑基础信息模型简单粗放,随着产品的丰富和客户对服务质量要求的提
入侵检测系统已经能够用各种检测方法来检测入侵,但是,大多数的入侵响应系统只是形成日志或报警来通知系统管理员,滞后的人工响应造成了不可恢复的严重损失。入侵检测系统迫
本文首先介绍了视频会议系统的一些基本知识,包括分类、组成、发展现状等,对ITU-TH.323多点视频会议系统及相关模块的设计和实现进行了探讨。其次优化了OpenH323协议栈,在Linux
随着互联网基础设施性能的不断提高和技术的发展,人们不再满足于从互联网上浏览以文本和图片构成的信息,而是更加青睐于高清晰度、高质量的互动多媒体信息。而多媒体信息需要占
面对竞争日益激烈,需求不断变化的国际市场,企业只有不断地缩短产品开发时间、提高质量、降低成本、改进服务,才能在激烈的市场竞争中立于不败之地。使用传统的协同设计开发模式