基于文本与视觉信息的图像检索技术研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:wukeda139
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字图像每天都以惊人的速度产生和发布。图像中含有的信息往往比文本更加丰富,在人们的日常生活中起着至关重要的作用。因此,如何更加有效的组织、管理大型图像数据库,并且能从中检索出符合用户要求的图像。是当前图像检索领域的研究热点。目前图像检索系统主要有两种类型:关键词索引的检索模型和视觉内容索引的检索模型。前者利用图像的标注信息实现检索功能,但因人类个体差异性而无法实现一副图像的统一标注及人工标注代价高昂等弊端,使该检索方案的发展遭遇严重的瓶颈;后者利用图像本身的视觉特征信息实现检索功能,该模型广泛应用于众多领域,但由于底层视觉特征与高层语义之间无法逾越的鸿沟严重阻碍了该方法的发展。研究者们提出了多种结合方案用以发挥两种不同模型优势的同时也避免他们的劣势,这些工作都使图像检索的性能得到了显著提高。本文围绕图像检索,对以自动标注替代人工标注的问题、图像特征表示的问题以及如何融合文本信息与视觉信息的问题进行了研究,具体研究成果如下:(1)现存的图像自动标注技术往往需要将图像分割为若干具有独立语义的图像块,然后比较图像块间的相似度并为待标注图像分配相应的关键词。由于日常生活中的图像种类繁多,有些图像(场景图像)包含的语义内容比较单一,在对这类图像标注关键词时,分割不仅会增加工作量而且可能会因分割过度而引入噪声标注。因此,本文根据待标记图像的复杂度在图像特征提取时采用不同的提取机制,并结合贝叶斯分类算法实现图像的自动标注。(2)传统的基于内容的图像检索方法只考虑了图像的内容特征而忽略了环绕文本的信息。本文针对这一问题提出了分两阶段进行图像检索的方法:首先,根据图像环绕文本的语义信息进行第一阶段的检索,通过该阶段的检索过滤掉一些相关性小的图像,保留相关性大的图像并组成图像库;其次,在该优化了的图像库上根据图像的视觉特征进行第二阶段的检索,并将检索结果作为最终结果返回给用户。检索过程中应用Word Net和IC算法分析、度量环绕文本的语义信息,并采用典型相关分析方法学习不同图像特征间的关系。(3)传统的基于KNN的图像自动标注系统在对图像标注时,将与待标记图像内容最相似的图像的标签作为标记结果,没有考虑图像的高层语义信息。本文研究了一种优化方法来对图像标注的结果进行优化,在标注过程中首先根据KNN算法选出与待标注图像内容最为相似的近邻集合,并根据近邻集合中的位置关系为每幅图像赋予不同的权值;采用Word Net及相关技术为待标注图像筛选出基本关键词集和扩展关键词集。该方法同时考虑到与图像内容相关的关键词也考虑到与图像语义相关的关键词,实验结果表明,标注结果也得到了较好的优化。
其他文献
随着无线通信技术的不断发展,无线移动自组网受到了越来越多的关注。Ad Hoc网络作为一种特殊的无线移动通信网,其无中心、自组织、抗毁性强等特点使原有基于固定的或有中心的MA
专利作为知识产权的核心要素,正成为各个国家和公司争相掌握的重要资源。企业的技术人员需要从专利管理系统中得到大量有价值的技术信息。对专利的实时检索、科学分析和研究已
SCORM(Sharable Content Object Reference Model)是由美国的教学管理系统全球化学习联盟(ADL:Advanced Distributed Learning)所制定的远程教育标准。SCORM标准强调电子化课
随着网络多媒体技术的快速发展,互联网上的图像等多媒体内容的数量正在以指数级的速度迅猛增长。因此,实现大规模互联网图像的有效管理和检索具有十分重要的现实意义。由于大
入侵检测系统是网络安全一个重要组成部分,可以较好地弥补传统的防火墙技术不能解决的问题。生物免疫系统与入侵检测系统有着许多相似之处,比如分布式保护、多样性、自适应性
无线传感器网络具有能量有限、通信能力有限、多跳路由、动态拓扑、节点数量众多且分布密集等特点。同时,无线传感器网络的还面临着一些分布式优化问题。如,任务动态部署、节
随着计算机技术和互联网的快速发展,社交网络、智能设备、传感器设备、云计算中心实时生成大量的信息数据,如何从中提取有价值的知识已成为一个巨大的挑战。形式概念分析由德
大数据正在成为继云计算、物联网、移动互联网之后新的信息革命高潮。无论是从数据传递及共享、数据存储,还是从数据检索及分析,信息技术正面临前所未有的挑战。信息表示和查询
软件测试是为了保证软件的正确运行而进行的一项重要活动,回归测试是软件修改后为了确认修改的正确性而进行的软件测试。回归测试策略分为重测所有(retest-all)和选择性(selec
随着WWW的迅速发展和普及,人们已经从信息资源匮乏的时代迅速过渡到信息极为丰富的数字化时代。面对网上海量的信息资源,人们很难迅速有效的找到真正所需的信息。因此,如何合