人脸及人体关键点在安防(核人)系统中的应用研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:kui5387
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉技术是人工智能研究领域的核心技术之一,而关键点检测技术则是计算机视觉领域的一项前沿技术。人脸关键点检测的目标就是自动定位人脸关键点区域,之后对人脸进行对齐校正,本质属于人脸识别前的预处理过程;而人体关键点检测的目标是自动定位人体关键点区域,之后对人体进行对齐校正,本质属于人体姿态估计前的预处理过程。关键点检测是计算机视觉中一个比较基础的研究课题,在许多计算机视觉任务中起着重要的作用,被广泛应用于实现人脸识别,动作识别、异常行为检测和安防等场景。本论文致力于对在人脸及人体关键点检测任务中因存在关键点定位不准确、遮挡、信息丢失等因素导致关键点检测鲁棒性差的问题开展研究,通过引入多任务融合方法,级联多阶段特征方法以及特征融合方法来解决人脸及人体关键点检测任务中存在的上述问题,并提出利用深度卷积神经网络的高级语义信息来提高检测精度的方案,建立了基于深度学习的人体姿态估计模型。主要研究工作和取得的阶段性成果如下:1、提出了一种人脸关键点的多任务融合方法。该方法在训练阶段使用了热图关键点、回归关键点、人脸姿态角对网络参数进行约束,在推理阶段仅需要计算回归关键点,在不增加推理阶段计算量的情况下提升了关键点检测模型的准确率。该方法利用了姿态角预测任务,对数据进行均衡操作,提升了大姿态角度下的人脸关键点检测的鲁棒性。同时验证了利用浅层细节特征和深层全局语义信息能够提升关键点任务的准确性,为后续人体关键点检测方法的改进提供了初步方法。最终得到了在一个限定算力下精度最优的人脸关键点检测模型。2、提出了一种新的级联特征聚合方法(cascade feature aggregation method,CFA)用于人体关键点检测。该方法级联了多个沙漏网络用于鲁棒的人体姿态估计,并通过级联多阶段将来自不同阶段的特征聚集以获得丰富的局部细节信息和全局上下文信息,全局信息用于指导关键点的合理区域,局部细节信息用于精细化定位,最终获得对于姿势、部分遮挡和低分辨率的鲁棒性。此外,研究通过对不同阶段的关键点检测结果进行融合,实现在几乎不增加计算量的情况下检测精度进一步的提高。3、在MPII(Max Planck Institut Informatik)Human Pose数据集(以下简称MPII)和LIP(look in person)数据集上的大量实验表明,我们提出的CFA算法在MPII和LIP上具有较好的性能。4、把人脸及人体关键点检测成果实际落地应用到安防(核人)系统中,达成了对可疑人员和需要救助人员的准确识别工作。
其他文献
根据GPC(Global Product Classification)分类标准,商品类别有几千种,实现快速准确的商品自动分类可以有效减轻工作人员负担。商品分类可通过商品图片、商品名称以及商品描述信息进行分类,本文通过商品名称对商品进行分类,由于商品名称属于文本且长度较短,因此本文着重研究对短文本分类方法改进并应用于商品分类任务。本文选择BERT模型进行微调并将BERT和其他模型结合应用于商品分类
学位
皮肤恶性黑色素肿瘤是一种恶性程度比较高的肿瘤,虽然其发病概率较低,但其在早期较难发现、转移快,因此死亡率较高。对于恶性黑色素肿瘤,早发现并且早治疗是治愈的关键。基于机器学习的黑色素肿瘤的分类问题已有不少研究,这些研究一般先是人工提取特征,然后对其进行分类,这样的方法较为繁琐,且提取不到较深层次的特征,导致黑色素肿瘤分类的效果一般。本论文使用深度神经网络的方法,对黑色素肿瘤图像进行分类,并使用扩充数
学位
在互联网快速发展,数据爆炸的时代,文本已经成为人们最为常见的情绪表达方式。对文本进行情感分析不仅可以给消费者提供参考依据,还能提升商家的整体服务机制。因此,对文本进行情感分析有着重要的研究意义。本文采用情感词典与深度学习相结合的方法,对在某点评网站爬取到的餐饮评论数据进行情感分析。本文的主要研究内容及取得的实验结果如下:(1)本文在对数据进行获取和预处理后,对网评文本的基本情感词典进行了构建。对于
学位
随着信息技术和互联网的高速发展,物联网越来越广泛地应用于各个领域中,在便利生活的同时,物联网环境面临的安全隐患也受到了更多重视。当前对物联网节点身份认证、数据传输、访问及存储的安全性要求也逐步提高,如何解决物联网环境中的信息安全问题,已经成为一个非常重要的研究课题。本文主要研究物联网设备身份认证和数据传输过程中的信息安全问题,提出面向物联网的椭圆曲线数字签名算法和基于国密算法的数字信封混合加解密算
学位
糖尿病视网膜病变是糖尿病的常见并发症之一,对患者的眼部损害十分严重。因此,国内外研究者开始通过近些年兴起的深度学习方法,通过眼底图像对患者进行诊断。其中,眼底视网膜血管分割能准确判断血管和非血管像素,可以辅助医生进行准确诊断并及早治疗;而糖尿病视网膜病变分类能对患者的病情自动分级,可有效缓解专业医生数量不足,效率不高的问题。因此,对上述两种方法进行研究意义重大。针对当前对眼底图像进行分割和分类存在
学位
目的 研究半夏泻心汤加减治疗寒热错杂证慢性萎缩性胃炎的临床效果。方法 84例寒热错杂证慢性萎缩性胃炎患者为研究对象,随机分为观察组和对照组,各42例。对照组采用常规西医疗法治疗,观察组在对照组常规治疗的基础上采用半夏泻心汤加减治疗。对比两组临床疗效及用药不良反应。结果 观察组治疗总有效率95.24%明显高于对照组的80.95%,差异有统计学意义(P<0.05)。两组用药不良反应发生率比较,差异无统
期刊
随着互联网的发展现如今已经进入大数据时代,在大数据的背景下图像分类已然成为模式识别以及计算机视觉领域的重点研究之一。传统的图像分类多是基于大量标签图像进行的有监督学习分类方法,而现实应用场景中数据中多是只含有少量标签。生成对抗网络作为一个生成模型可以和半监督学习相结合对含有少量标签大量无标签的图像集进行分类。但是传统的半监督生成对抗网络进行图像分类时会出现精度不高的现象,原因主要有:一方面由于生成
学位
水文模拟作为认识水循环的重要方式,经过半个多世纪的发展,已经从最初的经验性黑箱模型阶段进入到概念性集总式模型阶段,现在正处于分布式水文模拟阶段。分布式水文模拟计算量大,需要的数据参数众多,越来越多研究者提出分布式水文模拟并行计算方法,结合遥感数据来获取水文模拟的水文参数和植被参数,来实现对大规模流域进行水文模拟。本文基于Dis VOM水文模型设计并行计算系统,利用时空融合与光谱融合技术对遥感图像进
学位
情感计算是人工智能领域一个热门的研究方向,随着深度学习技术的发展,在人们的日常生活中出现了许多基于情感计算的应用。面部表情识别(Facial Expression Recognition,FER)作为情感计算中一个重要的分支,在人机交互、教育医疗等领域有着重要的应用价值。面部表情识别容易受到遮挡、人物姿态、光照变化等因素的影响,使得表情识别正确率降低。本文通过融合多尺度表情特征、结合多通道的方法,
学位
对创伤后成长的概念和测量,国内外炎症性肠病病人创伤后成长的内涵、影响因素和促进方式进行综述,并对未来开展炎症性肠病病人创伤后成长相关研究提出思考和展望。
期刊