论文部分内容阅读
在互联网技术飞速发展的今天,搜索引擎已经成为人们生活中必不可少的一部分。各式搜索引擎已经成为在信息过载的互联网中搜寻信息的有利工具。但是,搜索引擎的表现并不总是尽如人意。很多时候,当用户输入一个查询词,搜索引擎会返回成千上万的搜索结果,而其中只有很少一部分甚至没有网页是符合用户需求的。如何理解用户的搜索意图,找出符合用户需求的网页,并将最相关的网页置于搜索结果的前列,这成为众多学者研究的重要课题。社会化搜索就是在这样的大环境中走上前台的,它主要是借助用户的反馈信息对搜索结果筛选和整理,也就是强调人的智慧及参与,不再单纯依靠机器算法的直接判定。社会化搜索引擎的研究在业界一直没有定论,本文从社会化搜索引擎的基本原型出发,对国内外有关研究做了全面对比分析。同时对用户常见的反馈方式进行了阐述,从最符合用户操作习惯的角度出发,结合当今web2.0时代最流行的社会化标签,设计了一种崭新的搜索结果标签云展示形式。用户通过对搜索结果标签的权重进行更新操作,给搜索引擎反馈信息。通过研究用户点击标签的反馈形式,提出了用户反馈分值的概念,对用户反馈影响搜索结果排名的具体方法以及相应实现进行研究,并提出了一种基于用户反馈的网页排序算法。该算法结合Lucene开源检索系统原有算法,在接受用户反馈之后对结果进行二次排序,使最终的排序结果更接近用户的真实需求。最后,对基于用户反馈排序算法的社会化搜索引擎进行实验,对实验前后结果进行对比分析,结果表明用户的浏览和检索的质量和效率都有较大的提升。