基于用户标记的社会化搜索引擎的设计与研究

来源 :北京工业大学 | 被引量 : 2次 | 上传用户:nacle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网技术飞速发展的今天,搜索引擎已经成为人们生活中必不可少的一部分。各式搜索引擎已经成为在信息过载的互联网中搜寻信息的有利工具。但是,搜索引擎的表现并不总是尽如人意。很多时候,当用户输入一个查询词,搜索引擎会返回成千上万的搜索结果,而其中只有很少一部分甚至没有网页是符合用户需求的。如何理解用户的搜索意图,找出符合用户需求的网页,并将最相关的网页置于搜索结果的前列,这成为众多学者研究的重要课题。社会化搜索就是在这样的大环境中走上前台的,它主要是借助用户的反馈信息对搜索结果筛选和整理,也就是强调人的智慧及参与,不再单纯依靠机器算法的直接判定。社会化搜索引擎的研究在业界一直没有定论,本文从社会化搜索引擎的基本原型出发,对国内外有关研究做了全面对比分析。同时对用户常见的反馈方式进行了阐述,从最符合用户操作习惯的角度出发,结合当今web2.0时代最流行的社会化标签,设计了一种崭新的搜索结果标签云展示形式。用户通过对搜索结果标签的权重进行更新操作,给搜索引擎反馈信息。通过研究用户点击标签的反馈形式,提出了用户反馈分值的概念,对用户反馈影响搜索结果排名的具体方法以及相应实现进行研究,并提出了一种基于用户反馈的网页排序算法。该算法结合Lucene开源检索系统原有算法,在接受用户反馈之后对结果进行二次排序,使最终的排序结果更接近用户的真实需求。最后,对基于用户反馈排序算法的社会化搜索引擎进行实验,对实验前后结果进行对比分析,结果表明用户的浏览和检索的质量和效率都有较大的提升。
其他文献
手语是聋人的第一语言这一观点,已经为人们所接受,然而当今社会中信息传播的主要方式是建立在有声语言之上的,给聋人接受信息造成极大困难。手语合成研究的主要目的就是通过提供