论文部分内容阅读
图像检索一直以来就是学术界和工业界的研究热点领域,随着信息技术的发展和大数据技术的火热,人们在互联网上交流方式越来越集中到图像、视频等多媒体形式上,图像检索在互联网上发挥的作用也日益强大,在电子商务、互联网社交等领域中都有广泛的应用,如何从海量图片中找到符合自己意愿的图片成为图像检索领域的研究热点问题。本文将从图像底层特征、自动标注算法、用户日志学习三个方面,对图像中的语义鸿沟问题和维度灾难两大问题进行探讨,从而完成基于Web下的协同图像检索与标注的研究,其主要工作如下:首先,图像特征作为图像检索中最重要的依据,优秀的特征表达对图像检索的效果影响巨大,通过归纳和总结图像的视觉特征,对当前较新的特征提取技术进行改进,联合散射系数特征和尺度不变特征变换(SIFT)特征作为图像的综合特征Scatter-SIFT完成图像的底层特征匹配,提高了图像分类的效果。然后,在大规模图像检索中,图像标注完全靠手工标注完成是不现实的,因此本文对Fast Tag算法和Negative Boot Strap算法进行了分析,并在这两种算法的基础上提出了FT-NB算法对图像完成自动标注,综合利用Fast Tag算法和Negative Bootstrap算法的优点,从而提高图像标注的效果,并通过实验验证了FT-NB算法策略的有效性.一般情况下的图像检索系统没有充分利用用户的反馈日志信息,Web具有天然的广泛性,能将世界上任何地方的人连接起来,因此本文提出了利用用户对图像检索结果的日志反馈记录,联合FT-NB算法进行学习,对图像的标注结果进行迭代更新,从而进一步提高图像检索的效果。最后,综合使用以上优秀的相关算法和日志信息,设计和实现Web下的协同图像检索系统原型Just Pic1.0,方便用户检索图像并对检索结果做出反馈。针对Corel5K、Caltech101、ESP等公开图像数据集,使用FT-NB方法对用户日志记录进行学习,再次对图像进行检索,并对比以视觉特征结合词袋(BOW)技术的图像检索方法、Fast Tag算法、Negative Bootstrap算法的结果,通过实验说明了该实验系统的可行性以及日志学习算法的有效性。