论文部分内容阅读
随着Internet的发展,人们可以通过网络获得大量的信息资源,然而网上的信息浩如烟海,而且增长和更新的速度越来越快,从海量信息中找到所需的内容是一项极富挑战性的工作。而现有的信息检索技术却存在很大的局限性,它仅提供了基于关键字的检索,而忽略了关键字本身所含的语义内容,无法满足用户极具个性化的查询需求。针对以上问题,本文提出了一个基于Agent的智能信息查询系统-WIIRS(Web Intelligence lnformation Retrieval System),给出了对Web页面进行智能个性化检索的系统结构和实现原理。Agent技术是一种全新的分布式计算技术,Agent是分布式环境下持续自主运行的计算实体,具有主动性、交互性、反应性、自治性等特点。Agent技术一方面提供了一种全新的系统设计思想,提高了系统内实体的能力,使之比以前具有更强的能力;另一方面,Agent技术为解决分布式问题提供了有效的途径,为系统中实体的协作提供了合理的概念模型。基于Agent的信息检索技术是解决当前信息搜索所面临挑战的最有效的方法。本文对Agent技术与KQML作了简要介绍,重点讨论了在多Agent系统中,Agent之间通信和协作机制等。为使Agent与其它Agent等实体之间能够灵活地通信,本文提出了将XML集成到Agent的通信语言中以增强通信的语义信息和灵活性,并可在多种平台使用。本文提出的WIIRS系统采用了一种基于Agent的集成搜索引擎的结构,以Agent作为架构系统的基本组件,利用Agent的自治性和协作性来完成用户的个性化信息搜索,在系统设计中,通过采用Agent技术确定用户检索的个性化模式,使用K-modes算法聚类学习用户反馈信息,产生新的个性化模式,从而可以精确地满足用户的个性化检索需求,降低了检索结果的重复率,在一定程度上提高了检索的精度和效率。为提高系统的性能和易用性,还给出了基于用户偏好的成员搜索引擎的调度策略,在成员搜索引擎系统结构中,不仅利用本四川大学硕士学位论文体论中概念规范、语义丰富的特点,将用户的检索要求扩充成语义集,并且将检索到的文档通过文档分析器进一步过滤,最终得到与用户检索要求内容匹配度较高的文档,而且提供了一个并行处理的环境来显著提高搜索效率。本文最后分析了研究该系统的意义及课题尚待解决的问题。