基于Google Desktop的教育资源库全文检索系统研究

来源 :东北师范大学 | 被引量 : 5次 | 上传用户:mechanical123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文从全文检索技术的产生、发展和应用入手,深入探讨了全文检索的基本原理、方法和特点。通过对全文检索引擎Lucene系统结构、索引结构及数据流程的深入研究,详细剖析了全文检索系统的开发和应用。Google在2004年推出了自己的桌面搜索软件——Google Desktop,她是基于Google强大技术优势的基础上开发出来的,最大的优势就是不仅可以把它直接当作工具软件使用,还可以在它的基础上进行二次开发,设计出满足自己需求的搜索软件。Google桌面和以往的一些搜索引擎和检索系统开发包相比较有着诸多明显的优势。本文意在基于Google Desktop,利用其提供的SDK(软件开发包)开发一种全新的全文检索系统,并将自己开发的索引插件(index plugin)嵌入该系统,从而进一步提高全文检索系统的搜索能力。本文的重点放在了全文检索在教育资源库上的应用,通过全文检索技术、Google搜索技术和改进的索引创建策略的结合,开发一个基于Web的教育资源库全文检索系统。该全文检索系统不仅可以快速检索教育资源库中已存在文件类型的资源,而且随着教育资源库的扩充,还可以随时使系统增加新文件类型的检索能力,不断扩充系统的功能。从实验结果来看,该系统基本达到了设计的初衷。
其他文献
移动Ad hoc网络是由一组带有无线通信收发装置的移动节点组成的一个临时、多跳的网络。不需要中央控制设施。网络中的节点既是路由器,又是主机,作为对等实体连接在一起。非相邻
随着计算机及网络技术的飞速发展,越来越多的应用领域需要对大规模图数据进行处理。传统的单机处理模式不能有效地适应大规模图数据计算,因此出现了许多分布式环境下的图处理
随着互联网技术的迅猛发展,信息过载问题越来越突出地呈现在人们面前。推荐系统作为一种重要的信息过滤手段,能够把用户需要的信息智能地呈现到人们面前,为人们提供个性化的
学位
随着网络通信技术,移动通信终端设备技术的不断进步,人们可以通过智能手机等手持的移动通信设备远程控制电脑,人们的日常生活变得更加便捷。但是目前现有的各种远程控制方法大都
随着Internet技术的飞速发展和电子商务的普及应用,世界进入了信息化时代,为企业的发展提供了种种机遇和更为广阔的空间。传统的Web应用开发技术(比如ASP、JSP),将页面显示、商业逻辑和数据处理大部分都集中在页面代码中,商业逻辑、数据处理和页面显示强耦合,Web扩展维护比较困难,也不利于开发人员分工合作,在大型Web应用开发中愈发显得力不从心。迫切需要一种全新的Web应用设计技术,将页面显示
测试驱动开发是极限编成的最佳实践之一,采用测试驱动开发,可以获得简单、清晰、高质量的代码,近几年来受到软件开发人员的推崇。Kent Beck作为极限编程的创始人,提出了测试
J2EE是整合企业级服务的优秀平台,它结合Java编程的多种优点和过去10多年大中型企业软件开发中的经验,提供了一种基于组件的、以服务为中心的、多层应用的架构。但事实证明,J2EE
近年来,我国汽车行业迅速发展,为了在竞争中立于不败之地,厂家不仅仅重视生产技术的发展,而且对售后服务的重视程度也不断提高,很多大型企业都建立了自己的售后服务体系。三包理赔
WWW的飞速发展使其已成为全球信息传播与共享的重要平台,并成为人们获取信息的主要来源。但是随着信息量的激增,要想从WWW上获取一条有用信息的难度却越来越大。人们期望着一种