校园网搜索引擎核心技术——搜索器技术

来源 :北京机械工业学院 北京信息科技大学 | 被引量 : 0次 | 上传用户:mater
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅猛发展,网上的信息资源也在不断增加,搜索引擎技术给人们检索信息带来了很大的便利。但现有的搜索引擎都是运行在整个因特网上,对局域网内的一些内部资源不能进行全面地搜索。近些年,高校网络资源建设蓬勃发展,大部分学校都建立起了自己的校园网,校园网上的信息资源日渐丰富,但是现在几乎还没有出现特别适用于校园局域网的搜索引擎,以至于校内的很多资源并没有被高效的利用,基于校园网的搜索引擎技术就是适合于校园局域网内的一种搜索引擎技术。 搜索引擎技术主要包含四项核心技术,搜索器技术、中文分词技术、索引技术和检索技术。搜索器技术是指一个沿着链接漫游互联网文档集合的程序,主要功能是自动从互联网上的各网络站点抓取网络文档并从该网络文档中提取一些信息来描述该网络文档,为搜索引擎站点的数据库服务器追加和更新数据提供原始数据。基于校园网的搜索器与传统通用的搜索器是有差别的,除了它的搜索范围有一定的限定,还应该具有部署容易、运行代价小的特点,在普通的计算机上就可以运行。 本文对搜索引擎和搜索器分别作了概述,并对基于校园网的搜索器技术从设计到实现作了详细介绍。首先,介绍了整个子系统的体系和程序结构设计;然后,分析了其中用到的关键技术;最后,对搜索器子系统具体实现的过程,从开发平台搭建和用户界面设计、接口设计到系统联调等方面进行了介绍。不仅在原理上进行了可行性分析,并初步实现了基于校园网搜索器的基本功能,为基于校园网的搜索引擎技术打下了良好的基础,也为将来高校信息资源的共享提供了一个初步平台。最后文章总结了论文工作的主要成果及不足,对本领域未来发展做出展望。
其他文献
摘要:蛋白质功能预测是后基因时代的最基本的课题之一,迄今为止已经取得了一系列的研究成果。基于蛋白质相互作用网络进行功能预测是功能预测计算方法中的一个重要分支。然而,
搜索引擎(Search Engine)是一个对互联网上的信息资源进行搜集整理,然后供用户查询的系统。它包括信息搜集、中文分词、索引和检索四个部分。但是,面对大多数校园网是内网的情
当今,签名已成为世界上被广泛接受的个人身份辨识方法之一。自动签名鉴定系统的研究依据数据获取方式的不同,分为联机签名鉴定和脱机签名鉴定。迄今为止,对于联机签名鉴定方面的
随着计算机应用及计算机网络的普及,在各种考试中应用传统的纸张试卷进行的考试越来越少,取而代之的是基于计算机网络,以计算机为工具,在网络考试系统软件的支持下进行的现代化网
随着多媒体技术的不断发展和数字化媒体的广泛应用,数字版权管理(DRM)正在成为多媒体领域乃至整个社会关注的热点话题。DRM不仅包括数字内容的加密保护等技术措施,还包括信任
本文对基于CAN总线的嵌入式编程器的设计与实现进行了研究。该系统采用的ARM系统设计方案为手持设备和一般类型的应用提供了高性价比和高性能的微控制器解决方案。设计的人机
目前的代理签名和代理多重签名方案大都是基于普通离散对数难解问题上的,其安全性已经不能满足人们的需求。基于椭圆曲线上的密码体制具有更高的安全性,把它应用到代理签名的
计算机辅助设计(Computer-Aided Design)就是利用计算机强大的数据处理能力,在计算机内设置一定的环境,以程序来完成原本由手工所做的计算工作,帮助设计人员进行工程设计,从而提
随着我国社会主义市场经济体制的逐渐完善和WTO的成功加入,我国企业开始面临巨大的市场竞争压力,迫切要求更好的企业信息化管理工具。作为目前企业信息化技术发展的主流,ERP系统
由于火灾基础理论薄弱,无法建立准确的火灾模型,导致目前计算机三维建模技术在消防领域的应用十分有限。火灾原因认定是消防工作的重要组成部分,它自身的特点使得其在应用三维建