基于web日志挖掘的用户访问预测研究

被引量 : 0次 | 上传用户:baobei871011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
进入21世纪以来,Internet爆炸式的增长,使得人们真正体验到信息时代的优越性。但是作为Internet的管理和研究者,必需利用好Internet迅速增长带来的巨大数据资源,并从中挖掘出有意义的知识来指导Internet的建设,从而开启一个更人性化、更智能化的新Intemet时代。web日志挖掘主要研究用户的web浏览行为,从而理解用户的兴趣爱好和访问习惯,使得web站点更好的为用户提供服务。然而,web日志挖掘的核心是用户访问预测,即根据用户的历史访问信息和当前的访问路径预测用户下一步或将来可能访问的页面。我们可以利用预测结果提高服务器的性能,提高缓存的利用率和为用户提供个性化服务。本文分析了已有的用户访问预测经典算法的优缺点,提出了基于Markov链和关联规则的预测算法MAPA(Markov Chain And Association Rule PredictionAlgorithm),该算法首先使用二阶Markov链找到用户下一步或将来可能访问的页面集,生成预测候选集;然后再使用二项关联规则从正向和反向两个角度修正Markov的预测结果,从而生成最后的预测页面。该算法很好地结合了Markov链和关联规则的优点。本文提出了带反馈的Markov预测模型MPMF(Markov Prediction Model WithFeedback),该模型在预测过程中逐步构造历史预测树,把历史预测信息保存到历史预测树中,并根据用户的反馈来判断预测是否正确。在预测过程中,该模型首先用二阶Markov预测算法生成预测候选集,然后再利用历史预测信息动态的调整预测算法,从而生成预测页面。实验结果表明MAPA和MPMF具有较好的预测准确率;理论分析证明了这两种预测方法具有线性时间复杂度的预测效率。
其他文献
<正>进入新世纪以来,中国经济内部与外部都呈现出一系列新的特点和变化,对对外开放也提出了新要求。以人为本,全面、协调、可持续发展理念成为中国处理对外经贸关系,引领对外
目的探讨小儿气道异物取出术术中及术后发生去氧饱和的危险因素,为麻醉管理提供参考。方法按前瞻性临床队列研究设计,收集在2007年2月至2008年10月就诊于复旦大学附属眼耳鼻
<正>这是一个创新驱动的时代。创新是民族进步的灵魂,是国家兴亡发达的不竭动力,是经济发展的驱动力,更是财富积累的途径。创新的关键在于人,而人才培养关键在教育,什么样的
研究了一种新型钢-混凝土组合墙体,即冷弯薄壁型钢增强的混凝土剪力墙的抗剪性能。通过5个冷弯薄壁型钢混凝土剪力墙和1个钢筋混凝土剪力墙的拟静力试验,研究了边缘构件纵筋
美国退伍军人医院系统在二次世界大战后迅速发展,但近年受到效率不高的指责,主张并入民用医疗保险体系。本文作者在该系统工作数十年,阐述退伍军人医院系统的兴起,及其在医学
随着国内基础设施建设日益蓬勃,城市往往受到地形和场地条件的限制,基坑下穿或近接高架桥的综合问题也逐渐突出,类似问题保护标准往往较为严格。本文依托厦门第二西通道(海沧海底隧道)下穿华荣路高架段工程。在开挖12m深基坑过程中,需将华荣路高架桥其中一个桥梁基础,包括承台和桩基暴露,基坑外桥墩距支护结构最小间距约1.5m。桥梁桩基(钻孔灌注桩)直径为1.8m,长度为27m。因此,在深基坑施工期间,确保桥梁
本文基于产业集聚理论以及海洋产业的特殊性构建了海洋产业集聚与区域经济耦合发展的理论分析框架,并将研究视角从单个区域拓展至多边区域,探索研究了海洋产业集聚与区域经济
中国画在20世纪经历了一系列的存废、转向、变革的论争,进入新的世纪依然面临转型、创新的不同解读以及重新认识。尤其是在今天,市场逐步成为主宰艺术一切的新的权力话语。一
<正>黑龙江分行紧扣"三严三实"要求,坚持"三学"正思想,坚持"三查"找不足,坚持"三严"求实效,切实解决工作中"不严不实"的问题。"三严三实"专题教育启动以来,农发行黑龙江省分
随着利率市场化改革的深入推进,金融机构的存、贷利差收窄。加之宏观经济由高速增长转向中高速增长"新常态",引发的产业格局裂变,加速了落后企业淘汰进程。在此大背景下经营