论文部分内容阅读
随着互联网技术的飞速发展,互联网络上的信息量正在以几何级数的增长速度增长,因此,对网络上信息的高效检索成为互联网发展必须要解决的问题,搜索引擎技术得到了特别的重视并且正在飞速的发展。但是,当使用综合型搜索引擎来检索专业内容时,由于其结果存在范围性广、搜索目的不准确的缺点,往往找不到用户们需要的内容。随着电子商务和农业信息化的发展,网络中的农业数据开始高速增长,农业用户使用网络获取相关数据和资源也日益普及,增强了农业用户对信息搜索的依赖性。大部份农业信息网站的“网站内”数据库搜索模式不能满足人们对农业数据搜索越来越多的要求。
本文以用户对农业信息搜索需求为研究背景,在我国农业信息化日益发展之际,结合现今流行的垂直搜索理念和技术,以国内互联网上的农业信息电子商务网站和政府农业信息网站的农业信息为特定的抓取对象,进行自动采集,来实现农业信息的搜索功能。为了实现农业信息的全文检索,引入Lucene全文搜索引擎来实现系统的全文搜索功能。
本文首先阐述了搜索引擎的基本原理以及垂直搜索的关键技术,然后对基于JAVA的Lucene全文搜索引擎技术进行必要的说明,最后在对农业信息搜索业务分析的基础上,实现系统的基本功能需求和最终目标。
在实现系统功能需求和目标的基础上,运用UML分析设计技术和系统三层架构思想,对系统的功能设计和数据库设计进行了详细论述。
本系统在Windows+ Microsoft SQL Server2005+IIS+ASPX开发环境下,设计开发了农业信息搜索网站系统,在Windows+ Eclipse+JAVA+Microsoft soLServer2005开发环境下,设计开发了搜索系统的后台管理系统。因此,本文还对Ajax,eUML建模工具和.NET Framework框架进行了必要的说明。在此基础上,对系统各部分的功能实现进行了简要说明。