基于Lucene.NET的网络信息搜索系统的设计与实现

被引量 : 0次 | 上传用户:qinzhen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自从进入二十一世纪以来,随着信息化技术以及互联网技术的不断发展和创新。人类生活的各个方面越来越需要互联网上的各种信息和数据。因此在互联网上的数据和信息也在迅速的膨胀。由于互联网数据信息的广泛性,人们必须要通过某种手段对自身需要的数据信息进行筛选和选择。互联网数据信息有着很重要的利用价值,但是在海量的数据信息中对用户所需要的数据信息进行检索和筛选是当今互联网技术领域以及信息检索技术领域的一个热门话题。利用Lucene技术开发的网络信息搜索技术是当今互联网数据信息检索技术的热点。几乎成为了全文搜索的同义词。伴随着.NET开发平台不断地完善和发展,作为Lucene在.NET开发平台的移植版本,Lucene.NET也越来越流行。互联网数据信息的搜索主要在数据的挖掘和查找,多种数据信息的检索,良好的用户体验,优良的自然语言查询以及本土化查询等方面加强发展。数据挖掘技术主要应用在分布式数据库中,互联网中的数据信息与数据挖掘技术以及数据的检索技术相结合,可以给用户提供一个新的数据信息学习模式以及解决问题的方式方法。将Lucene.NET,C#开发语言以及数据库相关的技术与理论应用于互联网的数据信息资源搜索的过程之中,形成一个功能完善运行稳定的网络信息搜索系统,这样就能大大提高对互联网数据资源利用的效率以及准确性,并且也尽可能的避免了数据统计的错误,从而达到高效智能化利用互联网数据信息资源的目的。本文的主要内容如下:1.简要介绍了本文的研究背景,研究现状以及研究内容和意义;2.主要介绍了互联网搜索引擎系统的产生背景,发展阶段以及分类特点,并介绍了其应用在实际处理中的优点;3.描述了Lucene.NET以及网络爬虫相关技术的特点以及理论知识,并根据其理论设计出网络信息搜索系统的相关逻辑以及规则;4.网络信息搜索系统的实现部分。从系统软件结构,主要功能,数据库设计以及具体实现界面的角度全面介绍了该系统的实现步骤以及具体功能。5.对网络信息搜索系统的功能模块进行了测试,并根据测试结果发现该系统的不足并加以改进。
其他文献
综述了呼吸机相关性肺炎(VAP)的引发机制、发生原因以及不同体位预防VAP的护理研究进展。
<正> 带状疱疹是一种常见的皮肤病,其特点为数个族集水疱群排列成带状沿周围神经分布,常为单侧性,伴有神经痛。本病多发于胸背、腰腹部(肋间神经分布区),而发于眼睑头面部(三
氧是人体组织细胞中进行新陈代谢所需要的必须的一种元素,在人体中的主要载体是血红蛋白。血红蛋白主要分为氧合血红蛋白(Hb02)和还原血红蛋白(Hb)两种,前后两者的百分比就是
我国城市义务教育阶段的学生参加课外补习十分普遍。本文通过问卷调查,对城市义务教育阶段学生参加课外补习机率的影响因素进行了探讨,研究表明,家庭收入、父亲的受教育程度
目的:观察Aβ1-40寡聚体(beta-amyloid peptides oligomer, Aβ oligomer)对阿尔茨海默病(Alzheimer’s disease, AD)小鼠早期行为记忆功能的影响和其对磷脂酰肌醇-3激酶/蛋白
长期以来,人们都十分重视对于陶渊明的研究,但多数是从文学角度对其作品进行分析。本文作者试图从陶渊明作品的基本内容来分析其人生观,并由陶渊明对战争、士庶、自然及贫困
生活在不同文化背景下的人们,由于价值观念和生活方式的不同,在交往过程中难免会产生矛盾。本文以此为切入点,借助跨文化交际理论中高低语境和高低权利距离文化的研究成果,对
河西走廊历史上曾是中原通往西域、中亚、西亚以至非洲、欧洲的必经孔道,是闻名于世的丝绸之路最重要的干线路段之一。本文通过敦煌文献,对唐代河西走廊交通道路加以考证,认