论文部分内容阅读
本文利用大规模搜索日志对用户中文长句查询的情况进行了统计研究。通过分析搜索日志中的中文长句查询确定了经常发生的查询类型特点,并对用户搜索行为与查询长度、查询类型和查询频率的关系进行了研究。进一步了解了session中用户查询词修改情况,总结了用户查询修改方法和长度修改方面的特征和规律。最后,将不同长度的查询放到了三个商业搜索引擎中分别进行检索,计算其重叠率。通过以上的分析研究发现虽然目前大部分查询都是短查询,但短查询并不能满足用户所有的检索需求,特别是在搜索引擎向语义检索不断发展的今天,长句检索的分析和利