论文部分内容阅读
信息爆炸让越来越多的有用信息淹没在信息噪音中,如何有效地提取需要的信息并加以利用是支撑一个地区或者一个行业稳定发展的关键。搜索引擎技术的发展提供了一种比较有效的方法,但是随着信息量的快速增长,普通的搜索引擎技术越来越显现出信息覆盖率不高,精确度不够,信息繁杂定位不准确等搜索不利的情况。针对这种问题,一方面,专业的搜索引擎涌现出来,力图在特定信息资源的小范围内实现信息搜索的全面与精确;另一方面,元搜索引擎技术也得到了明显的发展,力求综合其他搜索引擎的结果深加工来实现搜索结果的全面与需要的精度。我国的农业信息化的发展也在迅猛的开展,农业网站数量增幅明显,农业信息也越来越丰富,如何帮助农业信息使用者在网络上有效地挖掘出需要的信息是制约农业信息化发展的瓶颈。几个农业专业搜索引擎已经开发成功并投入运行,但是就目前的服务质量与运行状况看,其仍不能很好的满足农业信息用户的需求。信息覆盖率不高导致其用户群体不够大,从而缺乏了进一步发展的根本动力。对此,通过对国内外主流搜索引擎、元搜索引擎及国内外面向农业主题的搜索引擎的研究分析,本文学习了现有搜索引擎技术的原理、技术等基本知识,了解了它们的应用现状,找出了他们的不足。在此基础上,本文提出建立一个面向农业信息的元搜索引擎系统的方法,并对其架构和具体运行过程进行了详细的描述。同时,针对现有搜索引擎技术地缺点提出了一种基于用户行为学习的方法,通过对用户行为的学习对搜索结果进行动态深加工,以图达到为农业信息用户提供更优质的搜索服务的效果。一方面,本文提出的元搜索系统可以集成综合性与专业性搜索引擎的结果信息,极大地提高农业信息的覆盖率,从而可以吸引广泛的农业信息用户群体;另一方面,本文提出的基于用户行为学习的方法,通过对用户在信息搜索时的各种行为的实时记录、学习与反馈,可以动态的调整结果的序列次序与类别的内容与序列次序,将最有效的结果与聚类标示展示在用户最容易获取的地方,大大的提高结果的有效性及结果可视化中所进行的聚类的有效性,给用户以优秀的搜索体验。最终,按照所提出的方法与构想实现的原形系统成功的证实了本文所提出的面向农业信息的元搜索系统的有效性及效率,同时验证了基于用户行为学习的方法的可行性。