论文部分内容阅读
相机技术的高速发展与硬件成本的显著降低,使得照片图像的获取成本越来越低。相机监控设备大规模普及,广泛应用于科学研究、安防、交通、物流等领域。在自然生态学领域,为了对自然界中的野生动物进行长期的监视和记录,研究物种生存和迁徙状况,保护濒危野生动物,全球各大自然生态研究机构和野生动物保护组织在各个自然生态区密集布设了大量相机陷阱,对监控范围内的野生动物进行拍摄捕获,采集到了海量的图像数据。如何快速、廉价地对这些图像数据进行处理分析,是一个需要解决的重要问题。近年来基于神经网络的深度学习技术高速发展,计算机对于图像的识别和分析能力越来越强。卷积神经网络算法能够自动学习图像的深度特征,帮助计算机实现分类、检测、分割等能力。各个领域大规模图像数据集的公开为神经网络算法的训练提供了丰富的资源,计算机硬件的飞速发展也大大提高了算法的执行速度。随着深度学习等计算机技术的出现和发展,生态研究者可以通过算法和程序自动进行数据清洗、物种识别、计数、目标定位等工作,节省了大量的时间和精力。但目前野生动物图像的检测与识别技术仍然存在图像监督标签稀缺、数据分布极不均衡、红外相机特殊场景、技术的落地应用等难题和挑战。本文主要研究基于深度学习的自然野生动物图像智能检测与识别,针对以上问题,本文提出了解决和改进方案,主要贡献有:1)提出一种有效的目标检测训练机制。通过对带有分类标签的图像进行目标检测,赋予目标框检测伪标签,实现弱监督的训练,得到更高性能的野生动物多物种检测器,解决了野生动物图像检测标签稀少、数据分布不均衡的问题。在与基线(Baseline)的对比表明,本文所提出的机制,能有效提高野生动物目标检测的精度,尤其是标签稀缺的罕见类的识别,并增加可检测物种的类别数量。2)提出针对红外图像的域迁移机制。使用生成式对抗网络,将夜间红外光场景的野生动物图像迁移为可见光场景的彩色图像,然后对原图和生成图进行检测和识别等工作。在三种野生动物上的实验表明,本文所提出的机制,能有效提高夜间红外图像的识别精度,通过融合策略将精度进一步提高。3)针对云南地区的亚洲象识别需求训练检测模型并开发应用系统。对前面得到的野生动物检测模型使用来自云南西双版纳地区的亚洲象图像进行迁移学习,得到适用于该场景和任务的新检测模型。然后基于此网络模型设计并开发离线检测程序和在线调用接口,提供给云南地区的组织机构使用,解决他们的现实需求。