论文部分内容阅读
随着图像识别技术的不断进步和深度学习的发展,图像识别日趋实用化,越来越多的科技公司开始涉及图像识别领域,图像识别已经成为人工智能的一个重要领域,广泛用于人脸识别,文字识别,指纹识别,车牌识别等方向。当今图像识别研究主要聚焦在两个不同的位置,一个是普通的图像识别,主要是区分不同种类的物体,比如“花” “鸟” “鱼” “虫”。这些物体的种类差别很大,也相对易于区分。另一个是精细种类图像识别,这些类别通常是普通类别的子类,比如“狗”这个普通类别,可以进一步区分为不同的品种,识别不同的品种的就是精细种类图像识别。相对于普通的图像识别,精细种类的图像识别更加困难,一个原因在于不同子类之间的差别比较小,而且容易受到视角、亮度、遮挡、背景等方面的影响。当应用一些较为复杂的分类器(如深度神经网络)进行精细种类图像识别时,另一个困难就是如何获得用于训练的大规模的高质量标注数据集,比如狗的品种的识别,可能就需要特定的专业知识,然而普通人可能并不具备这些专业知识,因此人工标记收集图片就非常的困难和昂贵。本文针对精细种类图像识别的难点,提出下面两种提高精细种类图像识别准确率的方法。首先,我们选择互联网上广泛存在的弱标注数据—一图像搜索日志,作为训练数据集。随着互联网和多媒体设备的普及,以图片为代表的多媒体数据呈现爆炸式的增长,每天都有数以万计的用户活跃在各大搜索引擎上,用户搜索图片时使用的关键词即可被当做图像的标注来使用。相对于获得人工标注的图片,获取这些图片更容易,能节约更多的时间和金钱。然而这些图片的属性有时并不能明确的标记一张图片,所以使用互联网上的图片作为数据集通常存在大量的不可忽略的噪声图片。本文通过随机选择数据集中的一部分图片训练一个深度网络模型,然后用网络模型对整个数据集的图片进行分类,得到每一张图片对应的弱标注类别的概率值。我们选择概率值较大的图片组成训练集,重新训练深度网络模型。实验表明这种方法能够有效提高某些数据集的分类准确率。接着针对大规模的数据集不易获取和精细种类图像识别困难的问题,为了分辨不同种类的细微差别同时兼顾同一种类的多样性,提出了新型的适用于精细种类图像识别的损失函数,能够显著提高训练数据集较小的精细种类图像识别的准确率。我们首先用训练集组成类间图片对和类内图片对作为双生子网络的输入,然后将双生子网络的两个子网的最后一层输出的概率抽取出来,接着使用我们提出的损失函数,认为当类间图片对的概率之差超过某个阈值之后就没有损失,同样,当类内图片对的概率之差小于某个阈值之后就没有误差。实验表明这种基于双生子神经网络的损失函数能够进一步提高精细种类图像识别的分类准确率。最后我们搭建了一个网站,实现在线的识别来展示我们的精细种类图像识别的成果。