基于本体的省情网垂直搜索引擎研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:baby3911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子政务建设的深入,政务门户网站建设的增多,其所承载的信息资源数量越来越大,门户网站也摆脱不了信息孤岛的宿命,传统的政府门户网站的建设模式也面临着一定的危机和挑战。门户加搜索的网站建设模式应运而生。也许通用搜索引擎能在获取信息的“量”方面有良好表现,但在获取信息的“质”方面,即让用户轻易找到自己真正感兴趣的内容方面不够理想。垂直搜索是为了能给某一特定领域、某一特定人群或某一特定需求提供有一定价值的信息和相关服务的,而本体恰恰是对领域知识概念的抽象和描述。因此,本体与搜索引擎结合,成为研究垂直搜索引擎的利器。那么如何构建应用本体,具体怎么将本体与垂直搜索引擎的几个关键技术结合起来就成为研究的难点。本文首先介绍、讨论了搜索引擎的基本概念、发展现状、评价指标和发展趋势谈起,分析了本体与垂直搜索引擎相结合的意义和必要性,然后介绍了本体的相关理论、自然语言处理的相关知识和开发基于RDF与OWL语义(semantic)Web应用程序的Java工具箱Jena,最后给出了基于本体的湖北省省情网搜索引擎的体系结构和具体实现方法。其中重点研究了以下的两个问题:1.提出与软件工程的原理相结合的IDEF—5方法来构造湖北省省情网本体的思路,并以protege3.2为编辑工具,OWL为本体开发语言,开发部分省情网本体。2.研究并提出基于本体的省情网垂直搜索引擎的体系结构。并针对其中基于本体的信息采集、基于本体的信息抽取、基于本体的检索等关键技术分别给出具体的实现算法。
其他文献
随着互联网技术与应用的迅速发展,Web服务作为部署在互联网上的组件,展现出良好的封装性、松耦合性以及跨平台性。因此,Web服务迅速成为了人们关注的焦点。近年来,互联网上出
随着web的迅速发展,人们从互联网上可以获取资料变得越来越多。与此同时,互联网也以其巨大的信息量给人们带来了前所未有的冲击。在用户利用web搜索引擎查找信息的过程中,往往出
无线传感器网络是一种新型的、无基础设施的、自组织的无线网络。近年来随着微电子技术、传感器技术及通信技术的发展,无线传感器网络技术发展迅猛,进展很快,而且在军事与民
Web2.0作为新一代互联网时代有着比Web1.0时代更为鲜明的特征和更广泛的用户群。在Web2.0浪潮迅猛发展的过程中,数据库管理已经成为各大Web2.0公司的核心竞争力。因此,开发基
计算机辅助设计开始发展于20世纪60年代,在工业设计中扮演着非常重要的角色,已经广泛的应用于工业设计的各个方面。随着科技的发展与时代的进步,人们对产品外观造型的要求逐
随着Web的迅猛发展,因特网上的资源越来越丰富,已经成为一个巨大的全球化信息仓库。Web上的资源不仅包括传统的有严格数据模型的数据库,如关系数据库和面向对象的数据库,而且
迁移工作流技术是近年来基于移动agent技术提出的一种新的工作流研究方向,特别适合需要频繁地传递大量数据,以及需要大量调用远程服务的分布式并发处理过程。文献提出了一个
形式化方法(Formal Method)基于严格的数学理论,能产生精确、无二义性的形式规约,为软件开发提供了严格的数学基础,对提高软件的可靠性有着非常显著的作用。形式化方法要求开
语义网(Semantic Web)是对现有Web的扩展,其目标是使Web上的信息具有计算机可以理解的语义。而本体(Ontology)则描述了其中的语义,本体在语义网中起到了重要的作用。由于语义
人类认知存在的局限性、信息描述的差异、度量的误差以及数据的动态变化等等,往往会产生许多不确定的数据。而随着不确定性研究的深入,未来世界的不确定性特征逐渐得到现代学