图像的语义标注及其改善问题研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:wyb112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数码照相机、具有照相功能的手机等设备的迅速普及,数字图像呈现出爆炸式地增长趋势,而且随着互联网的飞速发展,越来越多的人能够更加方便、快捷、经济地使用这些图像数据。目前面临的问题不再是缺少图像数据资源,而是如何在浩如烟海的图像数据中找到自己所需要的信息。如何对规模庞大的数字图像进行快速高效的检索,成为亟待解决的问题。现有的图像检索系统主要利用图像的语义标注词进行基于语义的图像检索,但是随着图像数量的激增,人工进行图像标注显然不现实。因此,对图像进行自动语义标注成为图像检索领域的重要问题,得到了学术界和企业界越来越多的关注。鉴于已有图像标注方法的标注准确性还未达到令人满意的程度,因此如何对已标注图像进行标注结果的优化与改善成为了图像的语义标注这一研究领域的重要问题之一。本文针对不同类型的图像,提出了一系列有针对性的语义标注以及语义标注改善的方法,主要研究成果和创新点表现在以下五个方面:(1)提出了一种基于LDA主题模型的图像标注方法。首先,利用图像训练集建立一个视觉词袋模型,并利用LDA模型计算待标注图像和标注词词典中各标注词之间的相关度,从而获得图像的初始标注。接下来,提出一种基于搜索的标注词扩展方法,将初始标注提交到图像搜索引擎,从搜索引擎返回的结果中选取与待标注图像相似的图像,进而从这些相似图像的周边文本中获取图像的扩展标注词。最后,将初始标注词集合和扩展标注词集合进行合并,获得最终标注。(2)提出了一种面向社会网络图像共享社区的图像标注方法。该类网站允许用户在上传图像时为图像提供标签,我们利用用户提供的标签对图像进行语义标注。首先,将待标注图像分割后的图像区域作为样例数据点,对用户提供的标签进行过滤后得到图像的初始标签,并将其所对应的图像视觉特征作为待排序的数据点,利用流形排序算法对图像的初始标签进行排序。接下来,利用Flickr提供的API函数以及加权投票策略对排序位次高的初始标签进行扩展,从而得到扩展标签。最后,将排序位次高的初始标签集合和扩展标签集合合并,得到图像的最终标注。(3)提出了一种面向图像共享社区中个人相册的图像标注方法。首先,利用位置敏感哈希函数将图像的SIFT描述符映射到哈希桶中,并将每个哈希桶看作直方图的一个柱,把待标注图像转化为直方图,通过计算直方图的距离得到两幅图像之间的视觉相似度,从而对个人相册进行去除重复图像的处理。然后,利用图像的视觉特征和图像GPS坐标构造三分图,通过对三分图的划分进行个人相册中图像的聚类。将Core15K数据集作为训练集,建立视觉词袋模型,为该数据集标注词词典中的每个标注词求出与之对应的视觉词语向量。对个人相册聚类后得到的图像簇,通过视觉词袋模型求出图像簇所对应的视觉词语向量,从训练集的标注词词典中选择与其相关度高的词作为图像簇的标注。(4)提出了一种基于二分图增强学习算法以及概念本体推理的层次化Web图像标注方法。首先,从Web页面中抽取图像的初始标注,通过概念本体对初始标注进行推理,将初始标注和经过概念本体推理得到的层次化扩展标注作为图的顶点,构造二分图。然后,通过二分图增强学习算法对初始标注和扩展标注进行排序,并提出了一个标注词选择策略,从排序后的初始标注词集和扩展标注词集中选取图像的最终标注词。(5)提出了一种基于图划分和图像搜索引擎的图像标注改善算法。该算法通过对待标注图像的候选标注词进行去噪处理,提高标注的准确性。算法的核心思想是将候选标注词作为图的顶点,将标注词之间的相关度作为边的权值,从而将图像标注改善问题转换为图划分问题。我们用两个参数对标注词间的相关度进行加权处理后计算出边的权值。第一个参数是根据图像搜索引擎返回结果计算出的候选标注词与待标注图像视觉特征之间的相关度,第二个参数是候选标注词在待标注图像所属页面中的重要程度,此参数仅适用于Web图像。然后,用启发式最大割算法对构造出的图进行划分,最后从图划分后得到的两个标注词集中选择其一作为最终标注。本文对图像的语义标注及其改善问题的研究,有助于理解图像中包含的语义概念,提升图像检索系统的性能,对多媒体领域的研究也具有较大的意义。
其他文献
<正>全球化既是优衣库最大的目标,也是最大的挑战。4月中旬,优衣库的母公司迅销集团公布了2018财年上半年业绩,截至2018年2月28日,迅销集团总收益为697.5亿元人民币,同比增长
国防科技大学以物理学一流基础学科的研究生培养为例,提出基于"FIRST"五位一体的人才培养体系,详细阐述了该体系的基本概念与内涵、特色、具体实施、初步成效和未来发展,并就
复杂的优化问题广泛存在于科学研究和工程应用领域中。仿生计算是一类有效的求解方法。膜计算是一种新的从生物细胞以及由细胞组成的组织和器官结构与功能中抽象出来的并行分
<正>一、问题的提出当你在工作岗位上工作了几年之后,接触的学生一届又一届。你会发现学生在理解很多简单的问题上也会存在偏差,何况有些稍有难度的问题呢?这种现象在科学研
会议
介绍一种折叠机构的初步设计方案,并对其工程化应用价值进行理论评估。
介绍了基于离散元模型(EDEM)仿真技术对运煤系统落煤管的磨损分析,对落煤管内部物料运动形态和设备壁板的磨损情况进行计算模型的可视化分析和数据化处理分析,为缓解磨损提供
本论文研究的内容是在单目固定摄像头监控条件下的场景信息估计以及遮挡条件下的目标跟踪问题。“场景信息估计”指的是估计场景内地面/非地面区域、地面相对深度以及地面相
采用低压直流电电解剩余活性污泥,优化了支持电解质的种类、加入量及电压梯度等工艺条件,并考察了在最佳工艺条件下SS去除率、污泥中有机物的质量分数(以VSS/SS计)、污泥pH及污
<正>唐代武则天临朝执政时,朝中有不少元老旧臣反对她。宰相裴炎暗中与徐敬业勾勾搭搭,图谋复辟。有次,裴炎派人给徐敬业送去一封密信,此事被人告发,书信被查获。但拆开一看,
计算机网络技术的飞速发展提高了企业信息资产价值在总资产价值中所占的比重,与此同时,信息资产的投保率并不高,未来有可能面临巨大的安全隐患。本文首先通过分析信息资产的