基于深度学习的证件照智能处理算法研究与应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:network_worm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会经济和科学技术的发展,证件照已经深入到人们日常生活、学习和工作中。办理证件、填写表格等场景都需要用户提供证件照信息。早期,证件照需要到专业照相馆进行拍摄,这种方式不仅费时费力也给人们带来了不便。如今,随着智能手机的普及以及深度学习的发展,使得利用智能手机进行证件照的智能处理成为可能。本文为了帮助用户便利的制作出既符合标准又符合心意的证件照,针对基于深度学习的证件照智能处理算法展开研究并应用。其主要内容包括:1.研究基于深度学习的证件照合规检测算法,提出了改进的分类网络结构和基于注意力的特征融合网络。改进的分类网络通过引入人脸解析辅助任务来帮助网络学习到眉毛区域特征。而基于注意力的特征融合网络则提出使用多层级特征来应对图像尺度问题,且使用空间注意力机制从众多人像特征中筛选出眉毛特征用于模型的最终预测。两个模块虽然引入了少量参数,却保持了不错的检测速率,且能够提升分类网络的性能和稳定性。2.研究基于深度学习的证件照智能分割算法,提出了基于U-Net的改进网络结构和渐进分割网络结构。基于U-Net的改进网络结构利用U-Net结构的优势并结合软分割模型的优点,能够无需三分图进行端到端的训练,并且提出先预测Mask图后预测alpha图的方式能够提升U-Net模型的性能。渐进分割网络在前者基础上提出一种渐进细化思想,通过增加网络输出,使得网络一步步的细化边缘信息。并且,本文利用深监督学习和渐进细化模块来实现,前者提出对每一次输出施加损失函数,后者提出使用前一次输出来优化后一次输出,使模型更多的关注细节区域。提出的模块在引入少量参数且保证检测速率的情况下,提升了模型的性能和稳定性,优于经典的软分割模型Semntic Human Matting。3.基于上述的研究结果,本文开发了一款证件照智能处理系统。本系统可以帮助用户方便快捷的制作出符合标准且合乎心意的证件照。该软件主要提供证件照合规检测、证件照制作等功能。
其他文献
基于生理信号的情绪识别是指利用计算机分析算法从生理信号中识别人的情绪状态的技术,具有客观、实时的优势,在多个领域具有良好应用前景。然而,基于生理信号的情绪识别领域还存在以下问题,使其无法进一步应用于实际场景中:(1)个体差异性,即跨用户情绪识别应用受到不同个体间存在的生理信号分布差异影响,导致模型精度下降;(2)信号非平稳性,即同一被试者的生理信号在不同时期受身体变化影响呈现出不同的分布,导致模型
学位
三维重建是使用拍摄或者投影等技术通过二维的相片恢复出被测物体的三维模型的技术。由于三维重建出来的物体模型相比于二维拍摄得到的相片能提供更多的信息,所以三维重建在文物建模、游戏建模、建筑设计和医疗器械等方面应用广泛。本文聚焦于结构光三维重建过程中的关键技术研究:即如何快速获取单一视角的高精度点云数据和如何将不同视角下的点云数据拼接成完整的被测物体三维模型。本文首先提出了一种新型的结构光相位移动算法来
学位
目的宫颈癌是发生于子宫颈鳞状上皮或腺上皮的一种癌肿,是最常见的女性生殖道恶性肿瘤。近年宫颈癌的发病率呈现增长趋势,发病年龄也趋于年轻化,这使得宫颈癌的预防、诊断和治疗的形势更为严峻。故本研究主要归纳膳食因素和生活方式与宫颈癌发生风险之间的关系,为宫颈癌的早期预防提供科学的理论依据。方法本研究采用文献综述法,对中国知网(CNKI)、PubMed和Web of Science等知名科学数据库近年来与膳
会议
以福建省泉州市的传统街巷为研究样本,通过空间量化技术探究泉州街巷形成的大致演变过程与形成逻辑;然后,采用等级、功能与宽度3个因子辨析街巷,并生成一套适用于泉州传统街巷空间的风貌改造策略.结果表明:泉州街巷的主要差异在于等级、功能与宽度的不同,同时等级、功能与宽度的变化也会导致街巷类型的转变,街巷的属性能够通过等级、功能与宽度共同组成的复合评价体系进行辨析;最后,通过梳理泉州现有的街巷格局,并针对街
期刊
近年来,随着全球范围内形成性评价的兴起,诊断测评在语言测试领域受到了较多关注。然而,相比于听力、阅读诊断测评而言,少数研究关注写作诊断测评。与其他写作测试(如分班测试、能力测试)相比,写作诊断测评不仅关注考生整体的写作能力,也关注考生写作的特点或细节,例如写作中存在的问题。因此,解读考生在写作诊断测评中的得分是必要的,有利于提高考生了解其自身写作能力以及不足之处。本研究将外语教学与研究出版社新推出
学位
以太坊区块链是由多方节点共同维护的数据平台。其上数据包括大量的区块、交易明细以及交易运行时信息,具有很大的分析价值,可以挖掘以太坊的潜在特征,以更好的理解以太坊;可以揭露以太坊上的安全问题(如:智能合约漏洞),以更好的抵御攻击。目前也存在许多以太坊数据分析工作,主要从特征分析和安全性分析两个角度展开研究。然而,均面临因大量且异构的数据源带来的数据收集难、数据存储难以及数据处理效率低等问题。为了解决
学位
为切实提高企业的投资收益,更好地促进企业的整合升级,文章简要分析了市场经济性背景下,强化企业金融投资管理的意义。结合企业金融投资风险的成因,深度分析了企业金融投资管理的现状问题,从金融投资管理制度完善、投资决策流程优化、强化风控管理力度以及投后管理等层面,详细论述了新时代企业金融投资的可行性策略,敬请参考。
期刊
目的:以急性心肌梗死介入治疗为例,分析医疗机构实施按病种分值(DIP)付费面临的优势、劣势、机遇、挑战,继而提出相应的发展策略,为进一步完善DIP付费方式提供思路。方法:运用SWOT分析模型,从优势、劣势、机遇、挑战4个方面综合评价。结果:优势分析方面:药品和耗材成本下降,医疗性收入占比增加,医保支付费用降低,患者报销比例增加。劣势分析方面:介入耗材价格下降,供应商供给不足,医疗机构易出现不规范诊
期刊
全国高校英语专业八级考试(简称专八)是针对我国英语专业学生的一项大规模标准参照考试和高风险测试,受到社会各领域的广泛关注和日益认可。2016年专八实施改革,其中写作部分从原来的命题作文调整成了先阅读材料后写作文,认为既考查学生的语言能力,也考查学生的思辨能力。如果要了解一项测试是否检测了其欲测的能力,需要对其构念效度进行验证。然而,之前从未有过相关实证研究从专八写作测试的构念上进行效度验证。鉴于此
学位
多标签图像分类任务旨在识别出一张图片样本中包含的所有相关标签或属性,其被广泛应用于医疗诊断、人体属性识别等现实任务场景。标签之间的相关性是研究多标签任务的关键。过去的研究者注重对标签之间的潜在语义联系进行提取,而忽略了标签的空间相关性。本文针对多标签任务设计了双分支注意力网络,加强了网络对标签之间空间相关性的建模能力,并与轻量化网络架构搜索算法相结合,实现轻量化且高性能的多标签图像分类网络。双分支
学位