论文部分内容阅读
随着近年来计算机视觉技术的不断发展和普及,目标检测与识别技术已经在医疗卫生、国民教育、城市交通、大众娱乐等越来越多的方面体现了其带来的便利和优势。其中Logo检测与识别技术作为目标检测与识别技术的一个重要应用,其在城市智能交通、文档检索分类、商业广告分析等领域也有着不可忽视的应用前景。传统的Logo检测与识别技术大多以文档中单一Logo为研究为切入点,其检测识别环境相对简单,应用研究难度较低。本文以较新的目标检测与识别技术为研究基础,以社交网络中运动品牌服饰Logo检测与识别为应用切入点,进行了基于深度学习的Logo检测与识别技术研究。主要工作包括数据集构建、数据集扩充、深度学习模型选择与改进三个方面。首先,本文对Logo检测与识别领域现有的公开数据集进行了调研分析,发现现有的公开数据集无法满足本文特定的研究与应用需求,所以采用了网络爬虫技术和人工筛选标注相结合的方式构造了一份适合本文研究使用的十种运动品牌Logo数据集FlickrSport Logos-10。然后,由于进行深度学习模型训练需要大量的标注数据,然而进行数据集的标记非常繁琐且会耗费大量的人力物力,所以使用了图像人工合成技术对FlickrSport Logos-10数据集扩充了10万张合成图片,同时在后续的实验中证明了该种数据扩充方式的有效性。最后,基于FlickrSportLogos-10数据集,选取了三种Logo检测与识别算法进行了对比研究,并对三种检测识别算法的检测识别效果、检测识别运行时间、模型可视化等方面进行了相关实验,最终总结出了三种检测识别算法所适用的不同应用场景。综上,本文所进行的研究充分说明了基于深度学习的Logo检测与识别技术的可行性以及优势性,并且验证了图片人工合成技术进行Logo数据集扩充的有效性。本文研究的Logo检测与识别技术相比于传统研究,其检测识别环境更加复杂,识别难度更大,同时使用的检测识别方案效果更佳。