论文部分内容阅读
随着互联网的迅猛发展,网上的信息资源也在不断增加,搜索引擎技术给人们检索信息带来了很大的便利。但现有的搜索引擎都是运行在整个因特网上,对局域网内的一些内部资源不能进行全面地搜索。近些年,高校网络资源建设蓬勃发展,大部分学校都建立起了自己的校园网,校园网上的信息资源日渐丰富,但是现在几乎还没有出现特别适用于校园局域网的搜索引擎,以至于校内的很多资源并没有被高效的利用,基于校园网的搜索引擎技术就是适合于校园局域网内的一种搜索引擎技术。
搜索引擎技术主要包含四项核心技术,搜索器技术、中文分词技术、索引技术和检索技术。搜索器技术是指一个沿着链接漫游互联网文档集合的程序,主要功能是自动从互联网上的各网络站点抓取网络文档并从该网络文档中提取一些信息来描述该网络文档,为搜索引擎站点的数据库服务器追加和更新数据提供原始数据。基于校园网的搜索器与传统通用的搜索器是有差别的,除了它的搜索范围有一定的限定,还应该具有部署容易、运行代价小的特点,在普通的计算机上就可以运行。
本文对搜索引擎和搜索器分别作了概述,并对基于校园网的搜索器技术从设计到实现作了详细介绍。首先,介绍了整个子系统的体系和程序结构设计;然后,分析了其中用到的关键技术;最后,对搜索器子系统具体实现的过程,从开发平台搭建和用户界面设计、接口设计到系统联调等方面进行了介绍。不仅在原理上进行了可行性分析,并初步实现了基于校园网搜索器的基本功能,为基于校园网的搜索引擎技术打下了良好的基础,也为将来高校信息资源的共享提供了一个初步平台。最后文章总结了论文工作的主要成果及不足,对本领域未来发展做出展望。