面向移动应用的人体图像多属性分类算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:alecsuss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体图像多属性分类任务在计算机视觉中是一个重要的研究课题,它属于多标签分类的一种,主要针对人的各个属性进行分类。相对于单标签的分类任务,多标签分类任务更加复杂,需要将众多问题同时解决,所以也更加具有挑战性。另外,由于手机移动端的计算能力有限,为了将模型部署到移动端,也需要通过模型压缩的方法来保证整个系统的实时性。为了解决这两个问题,本论文从两方面入手,旨在提高模型准确率的同时保证模型的移动平台适应性:一方面通过完备二级简化一致性匹配机制提高了模型的准确率,另一方面,通过基于批量归一化层(batch normalization,BN)的知识蒸馏算法在保证模型准确率的同时压缩了模型的大小。最后,本论文实现了一个基于深度学习的合规性判定系统。本文主要工作内容如下:(1)基于注意力机制的人体图像多属性分类算法研究:视觉注意力图一致性的匹配机制需要手动设计注意力图之间的映射关系,设计难度大。本论文针对这一问题,提出了一种二级简化一致性匹配机制,不需要手动设计注意力图之间复杂的映射关系,减小了一致性匹配的设计难度。之后,我们又提出了一种完备的二级简化一致性匹配机制,在ResNet50上,将平均精度均值(mean average precision,mAP)从86.8%提升至87.1%,考虑到在ResNet100这种庞大的网络上,视觉注意力图一致性算法的mAP只能达到87.5%,所以我们认为这种算法是简洁有效的。(2)知识蒸馏算法研究:目前对移动端而言,计算能力有限,所以出于部署的考虑,需要对模型进行压缩。本文提出了一种基于BN层的蒸馏方法,将教师网络中BN层中的参数作为知识直接传授给学生网络,在以MobileNetV3-large为教师网络以MobileNetV3-small为学生网络的蒸馏框架下,这种蒸馏方法可以将学生网络与教师网络的mAP差距减小至0.33%。之后,本论文又设计了一个更加精简的MobileNetV3-small-small学生网络结构,在我们提出的基于BN层的蒸馏方法的帮助下,这个学生网络与教师网络的mAP差距只有1.01%,并成功地将模型的参数量压缩到了教师网络的22%,将模型的计算量压缩到了教师网络的15%。(3)合规性判定系统实现:本论文基于上述两种算法实现了一个效果优异的轻量型合规性判定系统。为了追求较好的模型效果,在压缩框架中,我们没有使用MobileNetV3-small-small网络,而是使用MobileNetV3-small网络作为学生网络。最终,我们成功地将该模型部署到了手机移动端。
其他文献
在社会主义市场经济体制全面确立之后,我国医疗卫生机构尤其是公立医院,应以什么样的姿态和面貌呈现在人民群众面前,不同的管理者作出了不同的回答,有的人把物力角逐放在第一
时光的脚步转眼把我们带进了2011年,值此新年之际,元月9日下午,“铜陵市图书馆学会2011年迎新春联谊会”在铜陵市极度大酒店举行。安徽省图书馆学会秘书长、安徽省图书馆副馆长
发展“两型”社会是一项可持续发展的重大战略任务。加快区域图书馆集群建设是创新和科学发展公共文化体系、提高区域文化竞争力,是符合资源节约型和环境友好型社会建设的重要
2014年1月1日,我国实施了新的《火电厂大气污染物排放标准》,锅炉装置必须按国家要求的排放标准进行排放。2014年3月化肥厂动力车间对C锅炉进行脱硝改造,以满足我国新的《火
针对未配套放射性废液固化装置的AP1000核电厂,提出了适用于核电厂废物处理设施产生的超标放射性洗衣废水的非热能处理工艺,即:机械过滤(袋式过滤器)+深床过滤单元(两级活性
人才学是一门本世纪八十年代前后才兴起的新型学科。它以人才现象和人才规律为研究对象。假如我们借助这门新兴学科的有关理论和知识审视一下神话世界,则不难发现:不仅神话中
目的:探讨小儿实秘的中医护理体会。方法:36例实秘患儿均给予饮食护理、生活起居护理等一般护理,同时配合推拿、中药脐疗等中医护理,观察其护理效果。结果:治愈19侧,好转12例,无效5
问:我公司为增值税一般纳税人,公司销售的货物因质量原因给购货方的销售折让应当如何开具增值税专用发票?
牛传染性鼻气管炎病毒(IBRV)主要引起牛的呼吸道、生殖道等炎症反应,也可以引起呼吸困难及流产。IBRV的致病机制尚不清楚,目前发现IBRV的非结构蛋白和结构糖蛋白与病毒毒力相关,不