基于大规模搜索日志的中文长旬查询分析研究

来源 :情报学报 | 被引量 : 0次 | 上传用户:baimeng1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文利用大规模搜索日志对用户中文长句查询的情况进行了统计研究。通过分析搜索日志中的中文长句查询确定了经常发生的查询类型特点,并对用户搜索行为与查询长度、查询类型和查询频率的关系进行了研究。进一步了解了session中用户查询词修改情况,总结了用户查询修改方法和长度修改方面的特征和规律。最后,将不同长度的查询放到了三个商业搜索引擎中分别进行检索,计算其重叠率。通过以上的分析研究发现虽然目前大部分查询都是短查询,但短查询并不能满足用户所有的检索需求,特别是在搜索引擎向语义检索不断发展的今天,长句检索的分析和利
其他文献
目的探讨精细化护理对胃肠道手术患者心理状态、胃肠功能及血清炎性因子水平的影响。方法选择2018年2月~2019年12月我院治疗的胃肠道手术患者80例作为研究对象,随机数字表法
目的探讨人参皂苷Rb1是否可以增加脑缺血再灌注损伤小鼠脑梗死半暗带区LncRNA Malat1的表达。方法将30只C57/B6小鼠按随机数字表法分成假手术组、模型+生理盐水对照组、模型+
近年来排序学习方法以其优异的性能成为信息检索领域研究的一个热点。排序学习方法应用机器学习方法训练排序模型用于文档相关性排序,取得了良好的实验结果。在多种排序学习模
基于语言模型的检索方法为信息检索领域开辟了一个很有前景同时也具有相当挑战性的方向。与传统检索模型相比,语言模型不仅具有良好的理论基础,而且非常灵活,经过简单的变换很容
随着各种本体构建方法和诸多实验本体的相继涌现,以跨本体通信、跨本体协同为目的的本体对应相关研究在近年来受到国际学术界的普遍关注.为了最大限度复用现有本体,解决本体
针对X射线自支撑透射光栅在多能点单色成像光栅谱仪中的应用,采用电子束和光学匹配曝光、微电镀和高密度等离子体刻蚀技术,成功制备了周期为500nm、金吸收体厚度为350nm、占空
目的研究高血压脑出血的发病是否与同型半胱氨酸、尿酸的变化有关。方法连续收集2018年1月~2019年10月就诊于天水市第一人民医院神经内一科的高血压脑出血患者115例和高血压
本文详细叙述了一个用于信息检索的基于P2P的分布式爬虫系统的设计和实现过程。系统基于锚文本上下文进行主题相关性判定,采用P2P式的分布式结构,充分利用其动态增加新结点的
所有成功的企业,都是因时而变、顺时而动。尊重时代,才是智者的选择,也才能发展得更好。说起多元化,就想起人生第一笔稿费的故事。大概20年前,我在求学期间,当时写了一篇稿子