基于图像搜索日志的精细种类图像识别

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:yshanhong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着图像识别技术的不断进步和深度学习的发展,图像识别日趋实用化,越来越多的科技公司开始涉及图像识别领域,图像识别已经成为人工智能的一个重要领域,广泛用于人脸识别,文字识别,指纹识别,车牌识别等方向。当今图像识别研究主要聚焦在两个不同的位置,一个是普通的图像识别,主要是区分不同种类的物体,比如“花” “鸟” “鱼” “虫”。这些物体的种类差别很大,也相对易于区分。另一个是精细种类图像识别,这些类别通常是普通类别的子类,比如“狗”这个普通类别,可以进一步区分为不同的品种,识别不同的品种的就是精细种类图像识别。相对于普通的图像识别,精细种类的图像识别更加困难,一个原因在于不同子类之间的差别比较小,而且容易受到视角、亮度、遮挡、背景等方面的影响。当应用一些较为复杂的分类器(如深度神经网络)进行精细种类图像识别时,另一个困难就是如何获得用于训练的大规模的高质量标注数据集,比如狗的品种的识别,可能就需要特定的专业知识,然而普通人可能并不具备这些专业知识,因此人工标记收集图片就非常的困难和昂贵。本文针对精细种类图像识别的难点,提出下面两种提高精细种类图像识别准确率的方法。首先,我们选择互联网上广泛存在的弱标注数据—一图像搜索日志,作为训练数据集。随着互联网和多媒体设备的普及,以图片为代表的多媒体数据呈现爆炸式的增长,每天都有数以万计的用户活跃在各大搜索引擎上,用户搜索图片时使用的关键词即可被当做图像的标注来使用。相对于获得人工标注的图片,获取这些图片更容易,能节约更多的时间和金钱。然而这些图片的属性有时并不能明确的标记一张图片,所以使用互联网上的图片作为数据集通常存在大量的不可忽略的噪声图片。本文通过随机选择数据集中的一部分图片训练一个深度网络模型,然后用网络模型对整个数据集的图片进行分类,得到每一张图片对应的弱标注类别的概率值。我们选择概率值较大的图片组成训练集,重新训练深度网络模型。实验表明这种方法能够有效提高某些数据集的分类准确率。接着针对大规模的数据集不易获取和精细种类图像识别困难的问题,为了分辨不同种类的细微差别同时兼顾同一种类的多样性,提出了新型的适用于精细种类图像识别的损失函数,能够显著提高训练数据集较小的精细种类图像识别的准确率。我们首先用训练集组成类间图片对和类内图片对作为双生子网络的输入,然后将双生子网络的两个子网的最后一层输出的概率抽取出来,接着使用我们提出的损失函数,认为当类间图片对的概率之差超过某个阈值之后就没有损失,同样,当类内图片对的概率之差小于某个阈值之后就没有误差。实验表明这种基于双生子神经网络的损失函数能够进一步提高精细种类图像识别的分类准确率。最后我们搭建了一个网站,实现在线的识别来展示我们的精细种类图像识别的成果。
其他文献
如今的社会里,计算机在各行各业中逐渐替代并超越人类的能力,而让计算机拥有和人类一样甚至更高的智能是我们许多人奋斗一生的目标。人的智能由理性的逻辑思维和感性的情感思
本文主要用有限差分法求解一类带有Neumann边值条件的线性双曲型方程,文章共分为三部分.第一部分是绪论,主要介绍问题的实际意义、研究现状以及本文所要研究的内容和结果.第
本文研究在高维空间和异构环境中的带有自由边界和Bedding-DeAngelis响应函数的捕食模型.首先,我们给出两物种的蔓延-灭亡二分法,即两物种要么成功地蔓延到整个空间并在新的
视觉诱发电位(Visual evoked potential,VEP)是指被试当受到视觉刺激时在大脑皮层的枕叶区产生的相应脑电活动。目前对VEP的研究主要针对两个方面的应用:一是VEP的提取在临床
本论文主要以《桥梁——实用汉语中级教程》(第三版)的生词为研究对象,从教材中的生词量、生词等级、生词重现率和生词英文释义等方面进行研究,针对研究结果总结出此套教材在生词编写上的不足,并给出一定的修改意见。通过考察发现,本套教材从生词总量来看,没有达到《高等学校外国留学生汉语教学大纲(长期进修)》中要求的中等阶段学生所掌握的生词量,从单课中看,单课生词量过多,落差数过大;在生词等级上初等阶段、中等阶
目的:(1)了解肾移植受者疾病不确定感现状,分析受者疾病不确定感及其影响因素;(2)在Mishel疾病不确定感理论框架的基础上,结合文献分析,构建肾移植受者疾病不确定感与应对方式的理论模型;(3)验证构建的理论模型,分析肾移植受者疾病不确定感与应对方式的关系。方法:采用方便抽样法,于2019年4月至2019年7月选取在西安市交通大学第一附属医院移植随访门诊就诊的肾移植受者为研究对象。经研究对象同意
信息抽取是自然语言处理(NLP)领域研究热点之一,而实体关系抽取作为其基础任务尤为重要。实体关系抽取的目的是从大量的非结构化数据中剥离出具有结构化的实体然后对实体之间的语义关系进行判断,通常使用三元组的方式进行表示,此技术为之后搭建知识图谱、信息检索、自动问答等技术提供基础。目前实体关系抽取的研究方向大多是以单一的词向量表示或结合不同特征进行处理,在用多个方法处理后的结果,在不同关系类型的分类中,
立管涡激振动的预报模型中有大量的系数需要通过实验或经验来获得,附加质量系数和流体阻尼系数是其中的重要参数。在计算涡激振动中,这些参数将对最终预报结果产生非常重要的
导管架平台是应用最广泛同时也是最重要的固定式平台,长期受到风、浪等载荷的作用,并且导管架节点处存在着应力集中,因此导管架的管节点处经常存在着裂纹缺陷,严重影响了平台
我们知道海洋管道在海洋油气的运输当中起着十分重要的作用,海洋管道是十分脆弱的,所以其也是容易受到损坏的部件。当海洋管道的使用时间越来越多,那么由于各种因素造成的管