论文部分内容阅读
伴随着大数据时代的到来,计算机科技的不断创新和网络信息交流日盛,我们的生产生活方式每天都在发生变化,出现了各种各样新颖的信息产生方式和前所未有的获取途径,其中海量的图片,图像数据不但基数庞大而且更新变化的速度更是惊人,如何进行图像标注,让图像的标注更加快速、更加准确成为研究的一个热点。过去图像标注大多采用人工标注,标注效率低,准确率低,耗费时间长。消耗大量人力物力,标注结果也不理想而且标注词的选取会带有主观性,同时由于图像数据的海量增加,人们急需自动化得图像标注算法。自动图像标注也为后期图像的查询,整理,存储,分类等工作奠定了基础。为了提高图像自动化标注的效率,克服图像标注中文本信息与视觉特征的语义鸿沟,获得准确地描述图像信息的文本关键字,本文提出一种基于稀疏表达的图像自动标注算法,重点研究了图像的特征选择与稀疏化表达,并进行了相关实验,验证了该方法的有效性。主要内容如下:1.提出在稀疏建模基础上,降低图像维度解决图像的数据冗余在建立稀疏模型的基础之上,结合小波变换的的系数生成优势,分析不同图像特征在视觉感受中的重要性,对图像数据的可视化量化,把图像数据表示成向量的形式,赋予各类的特征向量不同的权重,降低不同图像的冗余向量,实现图像特征提取的完整性与准确性。2.给出融合多特征的图像特征向量,解决相应的图像稀疏表达问题本文在图像特征提取工作中,结合多种底层特征描述图像的相关信息,力求做到全面准确。通过提取图像的SIFT特征及HSV特征,建立稀疏模型,采用距离函数对图像的特征向量进行相似度量求出稀疏系数,实现特征向量的匹配,考虑到图像内容的相似性会体现到标注词上,因此对待测图像进行自动化标注。3.提出基于特征系数矩阵的图像标注词选取方法本文提出的基于稀疏表达的图像标注,实现SIFT特征和颜色特征的加权融合,充分运用了图像数据的稀疏化以及从已知信息到待标记图像的映射,构建稀疏系数矩阵,针对待标注图像子块与字典中图像子块的相似系数进行排序,确定部分图像的标注词,最后还原完整的图像选取标注词,完成图像的自动标注,提高了图像特征提取的质量,简化图像处理所用的实验数据,降低计算时间复杂度。