大规模中文搜索引擎的用户日志分析

来源 :华南理工大学学报(自然科学版) | 被引量 : 0次 | 上传用户:yjm17207928
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
北大"天网"是一个大规模分布式搜索引擎系统.文中对其用户日志进行了分析和研究.结果显示:用户对系统的访问时间并不均等,一天中早晨、下午和晚上各出现一个波峰;通常用户在一天内只进行1~2次内容不同的查询,多于2/3的用户点击了结果页面中的某些网址(URL);多数用户输入的查询串中只含有一个词项并且包含中文字符,其中以2~4个汉字居多;用户查看结果页面的时间大约是2~3 min;只有少数用户查看历史网页(或称网页快照).用户日志中不同查询串、不同用户和点击不同URL的数量满足Heaps定律
其他文献
从西安交通大学毕业,到在天津大学和美国费城宾夕法尼亚大学读研究生,在取得了宾夕法尼亚大学建筑学硕士学位,并且通过自己的努力逐渐获得费城BLT建筑事务所主管层重用的时候
应用停止流动 (Stopped flow)光谱仪反应器研究了水体中氯乙烯在 2 98K和pH为 3~ 11时的化学氧化 (O3/H2 O2 )降解及其动力学 .通过理论分析 ,建立了有机污染物降解过程的动力
<正>随着医院信息网络技术的发展,护理电子病历的应用使得护理病历更加规范化、科学化。我院作为全军信息化研究基地,护理工作基本实现资源共享网络化、信息采集无线化、数据
英语教学在我国高校已开展几十年,英语既作为一种语言也作为一种工具裹挟着以美国为首的西方国家意识形态,导致我国主流文化、意识形态与价值观面临外来文化与意识形态及价值
[目的]探讨首发脑卒中病人生活质量现状,并了解其影响因素,为今后全面提高脑卒中病人的生活质量提供依据。[方法]采用自行设定的一般资料问卷,Barthel指数量表,慢性病自我效
构建pPICZαA-NK重组质粒,并转化入E.coli TOP-10中,得到转纳豆激酶基因工程菌,提取重组质粒经单酶切,双酶切,PCR分析及序列测定,证明克隆到载体pPICZαA上的外源基因即为纳豆激酶
今天,爸爸妈妈带我去自然博物馆参观。我正津津有味地看动物标本时,忽然听到一阵兴奋的说话声。我扭头一看,发现许多小朋友正围着三个大大的“动物头”议论呢,我一下子就被好奇心
一切都源于一个美丽的构想。两年前,魏县按照省委、省政府的决策部署,经过认真踏勘,决定依托县城周围的万顷梨园和生态水系优势,给县城来个"大变样"。这一变,就"变"出了一个
早在2008年,卫生部已有禁令,羊胎盘不得作为普通食品原料使用。然而,“新华视点”记者近日调查却发现,作为羊胎盘的提取物,羊胎盘素却频频被非法添加在普通食品中,而且傍上“
报纸
主要介绍了相控型聚焦超声双焦点模式下声场理论的仿真和实验测量,结果表明测量与仿真理论值相符。