基于低级视觉和深度语义相结合的图像检索研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:zbgqx123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像检索是人工智能领域的研究热点之一。图像特征提取和描述是图像检索的关键技术。图像检索技术主要包括基于文本的图像检索和基于内容的图像检索。基于文本的图像检索技术已完全不符合时代需求,而基于内容的图像检索技术虽然能够较好地表达颜色、纹理、形状、局部特征和空间信息等视觉内容,但无法表达图像的语义特征,从而约束了该技术的进一步发展。近年来,卷积神经网络在图像分类、目标识别和语义分割等领域取得了举世瞩目的成绩。在卷积神经网络中,全连接层是一种类似于标签功能的深度语义特征,它在表达图像语义方面具有明显的优势。因此,本文提出了一种基于低级视觉和深度语义相结合的图像检索方法,以便于增强图像特征的表达能力和提升图像检索的性能,该方法的主要研究内容如下:1.提出了一种基元加权方案来提取图像的低级视觉特征。该方案首先将图像由RGB颜色空间转换到HSV颜色空间,并计算颜色、边缘方向、边缘梯度和灰度视觉特征图;然后使用六种纹理基元图案对视觉特征图上的像素差异变化信息进行加权;最后采用平均权值来描述图像特征。基元加权方案不仅能描述图像上的所有区域,而且考虑了六种不同的像素差异变化,能够提取丰富的局部结构信息。2.尽管基元加权方案具有上述优点,但它仍属于低级视觉特征提取方法,无法表达图像的语义信息。为了克服该局限性,本文利用三个经典的卷积神经网络(Alexnet、VGG16和GoogleNet)来提取深度语义特征,并对不同网络的特征进行比较,最终选择VGG16的FC7特征与基元加权方案提取的低级视觉特征进行融合。实验结果表明,融合后的特征不仅增强了深度语义特征的表达能力,而且弥补了基元加权方案无法描述语义的缺陷。3.提出了一种新颖的多阶段相似性匹配方法。它首先对第一次返回的图像进行二次查询操作,然后通过对两次返回的结果进行比较,最终可以在第一次返回的结果中,确定尽可能多的相似图像。实验结果表明,通过多阶段相似性匹配,基于基元加权方案的图像检索方法比基于纹理基元的图像检索方法具有更高的检索性能。并且,将深度语义特征融入到基元加权方案后,融合特征不仅超越了基元加权方案提取的低级视觉特征,而且在深度语义特征上也具有较大的提升。
其他文献
1.引言三维探地雷达探测是一种高效、无损的地球物理方法,可清晰描绘目标体的轮廓和位置,并对其延伸方向进行追踪,具有高分辨率、地下目标体真实归位的优势。三维探地雷达由
会议
贵广高铁途经贵州省贵定县昌明镇,并在此设立尖山营特大桥。现场监测数据显示大桥桥墩在雨季出现抬升,旱季又会向下沉降。桥墩(台)位移变化严重超出了高铁设计规范,对梁轨结构的安全存在着不利影响,也使得高铁经过尖山营特大桥时要限速。理论分析及膨胀性试验表明桥位异常升降的主要诱因是桥墩下覆膨胀岩土层的胀缩。拟建贵南高铁也要经过该地区附近,为了对贵南高铁的勘察、设计、施工以及后期运营提供依据,并且由于现如今对
内蒙古自治区作为我国北方玉米主产区省份,在玉米临时收储政策正式调整为“市场化收购+生产者补贴”机制的改革背景下,提出研究内蒙古土地流转对玉米生产技术效率研究的问题,
行人再识别指的是利用计算机视觉领域的知识,在不相交的摄像机区域中寻找特定行人的技术。行人再识别因其在公共安全领域中有着极为重要的应用价值,备受产业界和学术界的关注
叠层有机发光二极管(Tandem Organic Light-emitting Diode,叠层OLED)由两个或两个以上的独立电致发光单元经过电荷产生层串联组成,因在低电流密度下可实现高亮度、高效率和长
图像去雾一直以来是计算机视觉领域的研究热点之一,随着科学技术的进步和发展,对清晰图像的要求也越来越高。如何从雾天模糊图像中复原出清晰可见的无雾图像成为了研究的重点
互联网技术的飞速发展产生了海量的数据,从这些数据中提取出对实际生活有用的信息成了研究的热点问题。聚类作为一种经典的无监督机器学习方法因其可以获取数据的内在信息而
二维有机分子晶体因其出色的电荷输运效率,被认为是构筑高性能有机场效应晶体管的理想材料。但是目前发展的制备方法得到的二维分子晶体尺寸一般都小于12 mm2,且需要额外的转
许小令是近十年我国跳远项目的优秀女子选手,多次在国内及亚洲比赛中取得优异的运动成绩。本研究采用文献资料法、专家访谈法、数理统计法、对比分析法和录像解析法,对许小令
随着国家经济与科技的双重发展,越来越多新型电气设施接入电网,使得电网中的电压和电流更容易产生扰动。这些扰动会缩短设备的寿命、提高线损率,甚至带来严重的损失和后果。为了减轻电能质量数据采集传输的消耗,提高对扰动鉴别的智能性,本文将压缩感知(Compressed sensing,CS)技术与卷积神经网络(Convolutional neural network,CNN)结合,有效地解决了这两大问题。并