论文部分内容阅读
自从进入二十一世纪以来,随着信息化技术以及互联网技术的不断发展和创新。人类生活的各个方面越来越需要互联网上的各种信息和数据。因此在互联网上的数据和信息也在迅速的膨胀。由于互联网数据信息的广泛性,人们必须要通过某种手段对自身需要的数据信息进行筛选和选择。互联网数据信息有着很重要的利用价值,但是在海量的数据信息中对用户所需要的数据信息进行检索和筛选是当今互联网技术领域以及信息检索技术领域的一个热门话题。利用Lucene技术开发的网络信息搜索技术是当今互联网数据信息检索技术的热点。几乎成为了全文搜索的同义词。伴随着.NET开发平台不断地完善和发展,作为Lucene在.NET开发平台的移植版本,Lucene.NET也越来越流行。互联网数据信息的搜索主要在数据的挖掘和查找,多种数据信息的检索,良好的用户体验,优良的自然语言查询以及本土化查询等方面加强发展。数据挖掘技术主要应用在分布式数据库中,互联网中的数据信息与数据挖掘技术以及数据的检索技术相结合,可以给用户提供一个新的数据信息学习模式以及解决问题的方式方法。将Lucene.NET,C#开发语言以及数据库相关的技术与理论应用于互联网的数据信息资源搜索的过程之中,形成一个功能完善运行稳定的网络信息搜索系统,这样就能大大提高对互联网数据资源利用的效率以及准确性,并且也尽可能的避免了数据统计的错误,从而达到高效智能化利用互联网数据信息资源的目的。本文的主要内容如下:1.简要介绍了本文的研究背景,研究现状以及研究内容和意义;2.主要介绍了互联网搜索引擎系统的产生背景,发展阶段以及分类特点,并介绍了其应用在实际处理中的优点;3.描述了Lucene.NET以及网络爬虫相关技术的特点以及理论知识,并根据其理论设计出网络信息搜索系统的相关逻辑以及规则;4.网络信息搜索系统的实现部分。从系统软件结构,主要功能,数据库设计以及具体实现界面的角度全面介绍了该系统的实现步骤以及具体功能。5.对网络信息搜索系统的功能模块进行了测试,并根据测试结果发现该系统的不足并加以改进。