垂直搜索引擎的设计与实现

来源 :中国石油大学 中国石油大学(北京) | 被引量 : 0次 | 上传用户:cppgreate
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网上的信息每天都以指数量级的速度爆炸性增长,面对如此浩瀚的资源,搜索引擎为所有网上冲浪的用户提供了一个入口,毫不夸张的说,所有的用户都可以从搜索引擎出发到达自己想去的网上任何一个地方。因此它也成为除了电子邮件以外最多人使用的网上服务。 但是,随着信息多元化的增长,千篇一律的给所有用户提供同一个入口显然已经不能满足特定用户更深入的查询需求。同时,这样的通用搜索引擎在目前的硬件条件下,要及时更新以得到互联网上较全面的信息是不太可能的。针对这种情况,我们需要一个分类细致精确、对硬件要求低,数据全面深入、更新及时的面向主题的搜索引擎。由于主题搜索运用了人工分类以及特征提取等智能化策略,因此它比前三代的搜索引擎将更加有效和准确,我们将这类完善的主题搜索引擎称为第四代搜索引擎。 本文阐述了第四代搜索引擎主题搜索引擎的设计与实现,并着重分析了垂直搜索引擎的搜索策略及其算法,以及实现垂直搜索引擎的相关技术,在此基础上设计和实现了一个垂直搜索引擎。
其他文献
近些年,伴随着移动电子设备和无线网络技术的快速发展,相继出现了许多新型的网络,如深空网络、车联网、移动传感器网络等。这些网络与传统的基于TCP/IP协议的Internet网络不
在分布式数据库系统中,由于数据的分布和冗余,增加了分布式查询处理的难度和复杂度,因此如何进行查询优化是分布式数据库系统的一个重要问题。通过分析现有分布式数据库查询
随着信息化水平的不断提高,企业为了保持业务正常运转,必须保证信息系统的可用性。数据实时同步系统采用数据库层面的数据实时同步技术可以有效的保证企业信息系统的连续运行
进入二十一世纪之后,移动互联网和全球定位技术得到了迅速发展,越来越多的文本信息被附上了空间地理位置标签,这种含有空间地理位置信息的文本被称为空间文本对象。有时用户
该文对当前办公自动化系统的现状进行了分析,并结合现代企业在信息化过程中所遇到的具体问题和需求,经过详细分析并设计了该办公自动化系统.论文讲解了该办公自动化系统的整
Internet是上一世纪七十年代以文本数据传输为主的应用背景下诞生的网络,因此对正确性要求高,对实时性要求低。但随着多媒体网络应用数据流在Internet中的增加,使得Internet的“
随着地理信息系统(Geographic Information System,GIS)应用的深入和需求的扩大,在不同分辨率、不同空间尺度上对地理对象进行分析、计算和表达,已成为GIS研究领域内的热点和前
B方法是一种用于描述、设计计算机软件的严格方法,其作用一直延伸到代码生成。它用伪程序语言来描述需求模型,进行软件设计和实现。B方法建立在Zermelo-Frankel集合理论的基
当前Internet广泛使用的网络协议是IPv4协议。随着Internet的飞速发展,网络的规模急剧膨胀,使得地址资源日益稀缺,路由表迅速膨胀,这些问题使得目前的IPv4协议已越来越不能适应In
随着信息化的深入,目前一个企业内部多种Web应用系统并存的情况十分普遍,而它们大多分散开发且具有独立的用户认证授权机制。企业员工拥有多套用户名和口令,当访问这些应用时需