基于Lucene的搜索引擎应用与研究

来源 :湖北工业大学 | 被引量 : 0次 | 上传用户:fever1879
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着快速增长的网络信息资源,人们很关切如何从互连网上找出对用户有价值的信息。搜索引擎解决了用户检索网络信息的难题,它是人们获取信息极为有效的工具。随着越来越深入的研究搜索引擎,搜索引擎技术正在不断的向前发展。未来的竞争不仅限于互联网,本机、局域网、企业网内部以及无线网都将被包括在内。而搜索引擎的设计与实现是一项庞大的工程,要运用较多专业技术知识,所以也成为了一大难点。本文首先对搜索引擎的相关知识和工作原理进行了介绍,在实现搜索引擎过程中所使用的索引和搜索技术进行探讨并对搜索引擎的性能指标进行了描述。其次研究Lucene,分析Lucene实现全文索引和检索的过程,并对中文分词及其相关技术进行了叙述。针对Lucene的页面优先算法不足,论文还提出了一种综合利用PageRank算法和Direct Hit算法并考虑到分层结构的页面优先算法,以提高系统搜索性能。基于以上关键技术,论文采用.NET平台的开发环境,提出了一种基于Lucene的搜索引擎解决方案,并完成该模拟系统。最后,在实现模拟系统对其所使用的技术和方法进行总结,为设计出更优化的搜索引擎指出方向和方法,使其能更一进提高搜索引擎的工作性能。
其他文献
如何迅速从海量数据中获得准确的决策信息在现代企业日常决策活动中起着至关重要的作用,作为解决这个问题关键的OLAP技术中最核心的概念,数据立方体的实现已经引起了广泛的关
学位
VoIP的出现给传统电信网络带来了翻天覆地的革命性变化,会话初始协议(SIP)作为继H.323之后兴起的VoIP支撑协议已经逐步替代H.323在VoIP领域的地位,全球的大运营商都已经采用S
随着Web服务的发展,越来越多的应用集成采用了Web服务技术,Web服务的安全问题也越来越受到人们的关注和重视。Web服务环境松耦合、跨域、分布式、跨平台等特性,使得传统的单
无线传感器网络路由协议设计的首要目标是高效利用节点能量。GEAR(Geographical and Energy Aware Routing)路由协议是一种采用贪婪转发与节点能耗均衡性相结合路由方案的地
本论文的研究和开发工作围绕一个面向代码移动的IP_TASCM(IP Trace Analysis System based on Code Moving)分析系统进行,该系统的工作目标是为了解决大规模高速网络被动测量的
移动Ad hoc网络是一种不依赖于固定网络基础设施的、自组织的无线移动网络。其组网快捷、灵活,不受时间、空间限制的特点使它十分适用于军事应用或一些紧急场合的应用。例如,
随着互联网业务的高速发展,广域网在网络响应速度方面已经无法满足用户的需求。依靠增加带宽解决这一问题是一个方法,但由于响应速度还受到其它因素的影响而收效甚微,广域网
随着Internet的发展,“信息爆炸”不可避免地产生了。人们急切需要一种从Web上快速、有效地获取知识的技术,Web挖掘伴随着这样一个背景产生了,并且已成为研究热点。与传统的
学位