结合底层特征和高层语义的图像检索技术研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:renmin9999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术和多媒体技术的快速发展,多媒体图像的数量也以得到了极大地增长,如何从海量的图像库中快速、准确的检索到所需求的图像成为了当今多媒体技术中研究的热点问题。传统的基于文本的图像检索技术需要管理员手工对图像进行标注,不仅消耗了大量的人力,而且人工标注图像的主观性很大,对于不同的管理员,标注的结果可能不同。基于内容的图像检索技术是依靠图像的低层视觉特征(颜色、纹理、形状等)来进行检索的,但是人对图像的认识是一个利用自己的先验知识推理图像语义的过程,这样导致了图像的底层视觉特征和图像语义之间的“语义鸿沟”。为了减小“语义鸿沟”,本文将图像的高层语义和底层视觉特征结合起来,利用支持向量机(SVM)将图像的底层特征映射为高层语义。本文首先对语义的层次模型进行了分析,并且介绍了提取图像语义的一些常用方法。在分析了图像颜色、纹理、形状等特征提取方法的基础上,提出采用结合图像边缘和角点信息的低层特征提取方法,分别用不变矩和环形颜色直方图来表示图像的边缘和角点信息。本文重点研究了支持向量机的多分类技术,针对一些传统方法支持向量机多分类的缺点,例如:正负样本分布不均匀、识别率低、训练时间长等,提出了一种新的二叉树结构的SVM分类方法。以样本的空间分布为切入点,利用K-Mean聚类分析样本语义类之间的空间分布,采用聚类中心的欧氏距离作为量度,在树形结构SVM的根节点中首先确定空间距离最大的两个类别,将这两个类别分别确定为SVM正类和负类的中心,其他类根据它们与此两类的距离被分配到其对应的SVM类别中。对其他结点SVM类别,再按照根节点同样方式进行分类,直到最后得到单一的类别。以这种分配SVM正负类别的方式训练树形SVM,正负类别比较均匀,先分离开距离较远的类别,避免了它们对后续分类的干扰,提高了分类的准确率,而且除了根节点之外的节点中SVM所有数据量比其他树形结构方法都有很大减少,缩短了SVM的训练时间。实验结果表明,该方法在保证准确率的同时可以在较大程度上缩短图像检索时间。
其他文献
随着经济社会的快速发展以及无线技术的长足进步,各种无线业务蓬勃涌现,不仅极大地方便了人们的生产生活,同时也催生出更多的频谱需求,给原本有限的频谱资源带来了严峻的考验
随着战场电磁频谱争夺日益激烈,人类用频活动日趋频繁,雷达同时会受到多个有意或无意、有源或无源干扰的影响。来自多个点源的干扰进一步压缩了雷达目标与干扰信号在时-频-空
随着无线宽带通信的迅速发展和物联网的大规模应用,越来越多的设备需要分配无线频谱。这些设备对频谱的需求绝不是如今固定分配的移动通信和无线接入频率所能承载的。认知无线
随着图像处理技术及软件的快速发展,图像篡改变得越来越简单。那些人的肉眼很难分辨出的图像篡改,给新闻界、政治界、法律界、科学界和金融界带来了很大的麻烦,引发了互联网和大
空间分集或者说多天线分集技术因为能轻易地与其他分集技术(如时间分集和频率分集)结合起来,或者在其他分集技术无法应用时仍然能够为系统提供显著的增益,而得到了极大的关注
LTE-A是LTE的进一步演进,其对小区平均吞吐量和小区边缘用户的数据速率提出了更高的要求。中继节点(RN, Relay node)作为一种低功率、低成本的网络节点被引入到LTE-A系统中,