论文部分内容阅读
随着互联网的飞速发展,网络上的信息呈指数增长,造成“信息过载”和“信息迷航”,智能信息检索和个性化服务成为目前信息服务研究的重点。设计合理的智能信息检索系统,是实现智能信息检索和个性化服务的基础。因为信息检索中的文档一特征词的关系能够很自然的被看作形式概念分析中的形式背景,所以从二十世纪80年代开始,一些学者借助形式概念分析理论的核心数据结构——概念格对信息检索进行了研究。基于概念格的理论和应用在信息领域引起了越来越多的学者的关注。论文首先研究了当前搜索引擎关键词查询技术出现的问题:难以体现用户查询意图和查询结果不准确,由此总结了智能信息检索的需求:互动性和概念表达。然后探讨了用户兴趣建模技术的现状,提出了基于概念格的用户兴趣模型。接着利用概念格对概念检索的可视化特点,创造性地提出基于概念格的搜索引擎查询扩展方法,最后实现了基于概念格的查询扩展实验平台。本文的主要工作如下:(1)研究了概念格及其概念格的三种构造算法,通过算法的实现和数据分析,得到算法分析和性质总结。(2)提出了基于概念格的用户兴趣建模算法,该算法能够很好的解决自动用户建模方法存在的不足之处。基于概念格的用户兴趣建模算法具有概念内涵表达、可视化以及易于维护和手工扩展等优点。(3)提出并实现了基于概念格的个性化搜索引擎查询扩展方法。利用概念格的概念检索和可视化格结构,使搜索引擎查询扩展方法具备了概念化和智能化的特点。用户通过以初始查询词作为头结点的概念格,并沿着概念连线,在扩展的概念间进行个性化操作,并通过概念格的可视化概念结点图,挖掘概念结点的深层关系,探索扩展后的概念词和原始查询词的关系。本文给出了概念格查询扩展的功能、算法、流程、步骤、界面设计及数据分析等。基于概念格的搜索引擎查询扩展方法为用户推荐新的查询词和新的兴趣领域。这种方法符合搜索引擎和信息检索的发展趋势。