基于页面分块和链接分析的Web图片检索研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:zyf853
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
21世纪是网络的世纪,网络已经完全融入了人们的学习、工作和生活。随着Internet技术的高速发展,Web已经成为人们获取信息的一个重要途径。Web上图片资源日益丰富,人们对Web图片检索的需求也日趋强烈。现在成熟的商业图片搜索引擎都是使用基于文本检索的方法,主要原因是受系统性能的限制,以及庞大的用户群,密集的查询请求,以及较短响应时间等系统要求。目前有大量的研究集中在基于内容的图片检索上,提出了很多模型和算法,但都大多处于实验室研究阶段,离商业化应用还有很大差距。如何提高基于文本的图片检索性能,特别是从链接分析以及从环境文本分析图片语义的角度,这方面的研究很有价值。基于文本的相关检索技术已经非常成熟,经过很多年的实践验证和改进,其知识积累和相关工具值得在图片搜索中借鉴和重用。基于文本的图片检索中,难点在于确定图片与文字之间的关联联系。Web图片存在于网页中,周围有很多有用的相关文本信息,这些信息对于表达图像的语义属性有重要作用。而基于链接分析的图片检索目前还不够成熟,处在起步发展阶段,如何利用链接关系结合图片周围的文本,实现Web图片检索具有重要的研究价值和意义。另外,一个网页一般包含有多个语义块,每个块的重要程度也不相同,所以在块一级上做链接分析更加合理,语义相关度更高。本文着力于对Web图片检索的研究,从检索基础理论、网页语义分块、链接分析等方面着手,主要做了以下几方面的工作:①研究传统的图片检索理论和图片检索方法。在研究信息检索理论基础上,重点研究图片检索的概念,体系结构,图片检索的分类以及各自特点等。分析Web图片的环境特征。研究网页的页面特征以及网页中的图片特征,分析对比当前主要的Web图片检索方法。②通过分析HTML的组织结构特点,针对当前越来越流行的Web标准,提出了基于Web标准的语义分块算法。该算法实现了对网页的正确分块,是整个Web图片检索研究工作的重要基础。③建立基于分块的图模型,分析网页、块、图片之间的关系。在此基础上,对网页进行块一级别的链接分析,通过块级PageRank提高链接分析的语义相关性。④研究基于分块和链接分析的Web图片检索框架模型,并开发原型系统,对Web图片检索进行尝试。提取出图片的关联文本信息,分析查询词与图片环绕文本的相似度,根据Web图片关联文本的权重定义块的重要度,对块级的图片作链接分析,尝试提高Web图片检索的准确性。
其他文献
数据挖掘(Data Mining)是从庞大的数据集或数据库中提炼有用信息的科学。它汇集了统计学、机器学习、数据库、模式识别、人工智能等学科的内容,是一门新兴的交叉学科。聚类分
板材排样优化在现代工业生产中有着广泛的应用,而矩形板材排样优化又是其中最为常见的一类问题。给定一定数量的矩形板材以及目标零件的尺寸与数量,矩形板材排样优化需要找出
图像分割是计算机视觉的一个重要研究课题,图像分割就是把图像分割成具有相同强度、纹理、运动、颜色的子区域。平面图像分割已经取得了丰富的成果,但在许多情况下,曲面上的
在医学上利用光纤根管显微内窥镜进行牙齿疾病的诊断大大提高了诊治的准确性和有效性,但是由于采集过程中受到光照不足等不利因素的影响,利用内窥镜采集到的牙齿病灶图像不清晰
研究显示,不同的图像可以唤起人不同的情感,而传统的图像检索技术主要是根据图像视觉特征的相似性来进行图像检索,大多忽略了情感的影响和作用,这不能满足用户的真正需求,因
随着当前计算机网络和嵌入式系统的迅速发展,拥有独立操作系统的嵌入式系统在当今各个行业被广泛应用于网络环境中。因此,嵌入式操作系统受到越来越多的高校、研究机构和软件
随着社会的进步和人们生产生活方式的改变,网络上的图像数据的数量呈现激增的趋势。基于内容的图像检索技术作为近年来处理图像数据的重要手段之一,受到了广泛关注。将其推广
针对网络终端信息安全问题,为了提高嵌入式计算机系统整体的安全性,863课题“安全结构智能网络终端技术”提出并研制完成了一种具有自主知识产权的面向嵌入式应用的新型计算
无线传感器网络(wireless sensor network,WSN)是由部署在监测区域内大量的廉价微型传感器节点组成,通过无线通信方式形成的一个多跳的自组织的网络系统,其目的是协作地感知、采
在信息技术飞速发展的今天,大多企业在面对越来越激烈的市场竞争时,都进行了信息化建设并从中获益。虽然信息系统能够对企业的生产和经营管理过程提供强大的支持,但是一些信