论文部分内容阅读
人体图像多属性分类任务在计算机视觉中是一个重要的研究课题,它属于多标签分类的一种,主要针对人的各个属性进行分类。相对于单标签的分类任务,多标签分类任务更加复杂,需要将众多问题同时解决,所以也更加具有挑战性。另外,由于手机移动端的计算能力有限,为了将模型部署到移动端,也需要通过模型压缩的方法来保证整个系统的实时性。为了解决这两个问题,本论文从两方面入手,旨在提高模型准确率的同时保证模型的移动平台适应性:一方面通过完备二级简化一致性匹配机制提高了模型的准确率,另一方面,通过基于批量归一化层(batch normalization,BN)的知识蒸馏算法在保证模型准确率的同时压缩了模型的大小。最后,本论文实现了一个基于深度学习的合规性判定系统。本文主要工作内容如下:(1)基于注意力机制的人体图像多属性分类算法研究:视觉注意力图一致性的匹配机制需要手动设计注意力图之间的映射关系,设计难度大。本论文针对这一问题,提出了一种二级简化一致性匹配机制,不需要手动设计注意力图之间复杂的映射关系,减小了一致性匹配的设计难度。之后,我们又提出了一种完备的二级简化一致性匹配机制,在ResNet50上,将平均精度均值(mean average precision,mAP)从86.8%提升至87.1%,考虑到在ResNet100这种庞大的网络上,视觉注意力图一致性算法的mAP只能达到87.5%,所以我们认为这种算法是简洁有效的。(2)知识蒸馏算法研究:目前对移动端而言,计算能力有限,所以出于部署的考虑,需要对模型进行压缩。本文提出了一种基于BN层的蒸馏方法,将教师网络中BN层中的参数作为知识直接传授给学生网络,在以MobileNetV3-large为教师网络以MobileNetV3-small为学生网络的蒸馏框架下,这种蒸馏方法可以将学生网络与教师网络的mAP差距减小至0.33%。之后,本论文又设计了一个更加精简的MobileNetV3-small-small学生网络结构,在我们提出的基于BN层的蒸馏方法的帮助下,这个学生网络与教师网络的mAP差距只有1.01%,并成功地将模型的参数量压缩到了教师网络的22%,将模型的计算量压缩到了教师网络的15%。(3)合规性判定系统实现:本论文基于上述两种算法实现了一个效果优异的轻量型合规性判定系统。为了追求较好的模型效果,在压缩框架中,我们没有使用MobileNetV3-small-small网络,而是使用MobileNetV3-small网络作为学生网络。最终,我们成功地将该模型部署到了手机移动端。