一种基于网页分割的Web信息检索方法

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:spring2011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种基于网页内容分割的Web信息检索算法.该算法根据网页半结构化的特点,按照HTML标记和网页的内容将网页进行区域分割.在建立HTML标记树的基础上,利用内容相似性和视觉相似性进行节点的整合.在检索和排序中,根据用户的查询,充分利用区域信息来对相关的检索结果进行排序.
其他文献
伴随着商业实践和信息技术的飞速发展,竞争情报逐渐从“关于竞争的情报”转向“关于情报的竞争”,为情报工作带来了新的机遇与挑战。本文以作为一种竞争情报理念的信号分析为论
结合建设国家纳米科学中心纳米文献资源的实例,探讨以满足科研用户信息需求为导向的学科文献资源的建设原则,在对学科领域文献资源进行计量分析的基础上,设计学科文献资源保
城镇化市场经济快速发展的同时,房地产开发项目作为最具代表性的行业,如雨后春笋般出现,为提高房地产业经济价值,应落实房地产开发项目前期管理工作.本文首先介绍管理内容及
介绍国外不同图书馆的管理模式和特点,并通过对不同国家不同图书馆的相互比较,试图得出国外图书馆在资源建设和文献信息服务方面的共性,希望对国内图书馆发展有一定的借鉴作
城市街道景观设计是城市景观设计中重要的一部分,本文主要从城市街道景观的定义、现存的问题以及应遵循的原则等方面探讨了城市街道景观设计对城市景观设计的影响.
针对图书馆员职业资格认证制度问题进行论述,就这一制度的研究背景、内涵、国外图书馆员职业资格认证制度的实施情况、我国对这一制度的探索以及实施这一制度需要处理好的若
科技创新不断推动着经济的发展和社会生活的改善,对其影响力的评价研究一直备受关注。尤其是在新时期科技革命的背景下,不断涌现出更多具有颠覆性特征的创新技术。此类颠覆性技
根据“公开是原则,不公开是例外”的指导思想,以信息公开的一般标准--必须公开的信息、经申请可以公开的信息、不得公开的信息这3类信息为研究的入口,以开展理论创新和在实践
针对新形势下的政府信息公开进行研究,认为当前的政府信息公开存在以下三方面的挑战:信息时代的挑战、公民意识的挑战、政府职能的挑战;并试着从政府的创新与实干、公众的权
在分析传统图书资料修复方法的基础上,提出一种新的数字图书资料自动修复的计算机处理方法,阐述模式识别技术在数字图书资料自动修复和整理中的应用,该方法通过对图书资料进行扫描、二值化和图像重建等处理,达到对不清晰的图书资料自动修复的目的,以期实现数字图书资料的数字化处理。最后通过一个实例验证了该方法的有效性与实用性。