论文部分内容阅读
在我国加入WTO组织以后,经济实力得到快速的发展,物流这个新兴的行业也得到了长足的发展。由于我国物流行业处于快速增长期,各方面都是爆炸式的增长,中国物流中心原来的手工检索方式已经不能满足经济发展的需要。迫切需要开发一套信息检索系统来提高物流中心检索的工作效率。与此同时,随着Internet的不断发展,现已成为全球最大的共享信息基地,如何快速的获得大量有效的信息,获得以后如何准确地从中检索出所需要的信息也已成为物流中心检索系统需求的重点。目前,信息检索已经发展到网络化和智能化的阶段。信息检索的对象从相对封闭、稳定一致,扩展到开放、动态、更新快的Web内容,信息检索的用户也很大得改变。适应网络化、智能化以及个性化的需要是目前信息检索技术发展的新趋势。主要的检索热点集中在知识挖掘、异构信息整合检索、全息检索。根据中国物流中心提供的需求中我们知道,工作人员需要从数据库中检索大量的物流文献资料。这样就会碰到大量数据的检索问题和检索精度的问题,如何能够提高物流中心工作人员的检索速度和准确度也就成为我们开发此检索系统需要关注的问题。同时,如何利用当前WWW上丰富的信息资源来扩充文献资料库也是我们要关注的问题。本论文的主要工作就是从理论上讨论了如何通过比较成熟的算法的介入来提高中国物流中心检索系统的检索效率,本文主要从研究了一些比较成熟的Robot搜索算法、分词算法和分类算法,并对这些算法做一些改进应用于中国物流中心的信息检索系统中。