论文部分内容阅读
随着计算机网络的快速发展,尤其是网络信息量的急速增加和使用人群的迅速扩大,Internet已成为人们日常生活中必不可少的组成部分,Internet网络的管理和信息服务等已成为人们所关注的全球性热点。
Web信息量的不断增加以及用户需求的不断变化对网络资源获取和服务提出了新的挑战。作为一种网络资源的获取方式,网络搜索引擎取得了极快的发展。但是,现有搜索引擎无论在数据量,还是在结果的质量等方面均不能满足用户要求。而且,随着网络容量的不断增加,现有的普通搜索引擎的搜索能力需要不断提高,而这种能力提高需要硬件性能的支持。近年来,出现了仅面针对某一方面主题进行搜索的主题型搜索引擎,与普通搜索引擎不同,面向主题型的搜索引擎只覆盖某一主题的Web区域,这样工作量就小得多,同时又有能力为客户提供更好的服务。
本论文对搜索引擎及信息检索技术作了介绍,并结合在某大型钢铁企业的实践,制作了一个为钢铁企业搜集信息的主题型搜索引擎。面向钢铁企业的主题型搜索引擎采用了从百度搜索引擎提取数据和用Robot程序在网络中漫游两种方法采集数据,取得了较好的效果。制作这个搜索引擎的目的是为了搜索面向钢铁生产的信息,并在钢铁生产厂的内部网上进行发布。