论文部分内容阅读
近年来,适用于不同研究任务的数据集不断涌现,规模不断增加,同时场景也越来越复杂。数据集的建立为科学研究的发展提供了数据基础,而数据集规模的增大、数据类型的多样化等也同时给现有的理论和方法提出了新的挑战,也因此使得新的具有更高性能的算法不断被提出。然而,目前国际上还没有应用于野生动物个体识别研究的大型数据集,已发布的个别动物数据集普遍存在数据量小、图片质量差等问题。这在很大程度上限制了目前动物面部识别算法的研究进展。目前,在动物个体识别领域,大多直接利用目标分类算法;而在利用动物面部信息进行个体识别研究方面,也基本是直接利用或稍加改进现有的人脸识别方法。然而,动物的面部结构、器官形状和面部纹理等诸多方面和人类存在着较大差异。因此,将现有的人脸识别算法直接应用于动物面部识别,其效果将大打折扣,然而,目前还未有专门针对动物面部识别问题提出相应的识别算法。针对上述问题,本文首先构建了首个大型灵长类面部数据集。在数据集建立的过程中,提出了一种快速有效的灵长类面部自动检测方法来获得源图像中的猴脸区域图像信息。接着,提出了一种改进的卷积神经网络(Convolutional Neural Network,CNN)模型Fine-Grained CNN(FCNN)以实现较为准确的灵长类面部识别。本文主要工作如下:(1)针对灵长类动物图像识别研究中缺乏大型面部数据集支撑的问题,采集并构建了一个大型的较完备的灵长类动物面部数据集。本文探索出了相应的数据采集的方法和策略,最终完成数据集的建立。该数据集共包括43个灵长类物种,共1040个体,102399张清晰的面部图像。每个个体的图片,平均数量保持在100张左右。所采集的物种包括金丝猴、大猩猩、狒狒等。最后,通过实现现有的方法来验证该数据集可应用于灵长类的个体识别,性别识别,年龄识别等研究。(2)给出了一种基于CNN的灵长类面部自动检测方法,以实现动物图像的快速截取,提高数据集构建效率。本文给出了整个算法流程,通过HSV色彩空间量化检测灵长类面部在原始图像中的疑似区域,然后利用已有面部数据训练CNN模型,以完成猴面筛选与定位,最终完成猴面检测。(3)给出了一种改进CNN模型(FCNN),以实现灵长类面部较为准确的识别,此方法能够降低训练成本、提高识别准确率。鉴于灵长类面部整体构造相似度高,多覆有毛发等特点,需要同时兼顾毛发和五官的特征提取,FCNN中利用两个3×3卷积核和三个3×3卷积核交替使用代替传统CNN中大尺寸卷积核。实验结果表明,该方法能够快速有效地进行各种场景下的灵长类动物面部识别。