基于马尔科夫模型的WEB日志挖掘的研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:nilaomei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在网络时代的今天,不同类型、不同内容、不同结构的网站浩如烟海,而网站建设所面临的一个主要问题是:如果能够深入了解用户的浏览兴趣和浏览习惯,预测用户的浏览路径,就可以通过修改网页结构来提高用户的浏览效率,从而提高网站的访问量和访问效率。Web日志挖掘技术可以对用户的浏览模式做出归纳和预测,Markov模型是一种简单而有效的预测工具,但现有的预测方法存在着一些不足之处。因此,改进基于Markov模型进行用户浏览路径预测的方法,成为Web日志挖掘的一个新课题。本文对国内外关于Markov模型浏览路径预测的研究现状进行了综合分析,指出了现有的预测方法在适用范围及花费时间上存在的问题,提出了改进方案,对如何改进基于Markov模型的预测方法这一问题进行了研究。   本文提出了基于网页类的预测方法。用传统Markov模型进行预测,无法反映用户在不同语义类别网页间的浏览习惯。网页类预测方法针对这个问题,利用多维层次化数据聚集的思想对网页分类,并通过在网页类别上进行路径预测得到类路径,从而弥补了传统Markov模型的不足。   其次,提出了动态分类预测模型,主要解决多Markov链模型的学习算法时间复杂度过高的问题。动态分类预测模型采用了聚类的思想对用户分类,在每一类用户上进行浏览路径预测,同时能动态更新用户的特征。该模型下的分类算法在时间复杂度上,明显优于多Markov链模型。
其他文献
新世纪信息时代的来临加速了跨组织商务活动的迅猛发展,服务交互活动的规模与涉及领域不断扩大,组织边界对业务流程的限制作用也开始逐渐降低,很大程度上加速了组织间的交流
目的 探究分析全膝关节置换术与单髁置换术治疗老年膝关节骨关节炎的疗效.方法 将我院所在科室收治的76例患者根据住院时间分为两组,其中,观察组38例,采用单髁置换术,对照组3
签密技术集加密技术和签名技术于一身,既能够满足加密技术的保密性,又能够提供签名技术所实现的不可伪造性和不可否认性。签密技术相比先签名后加密的算法不仅节省了系统的存
移动Agent是Agent技术和分布式计算的混合体,可以在异构网络中自主地从一台主机迁移到另一台主机,并可与其它Agent或资源交互。由于其得天独厚的优势,应用前景十分广阔。例如
考试在中学教学中起着指挥棒的作用,是检测教学质量的一种重要手段。现在中学的各种考试大都采用传统的考试方式。随着计算机应用的迅猛发展,网络应用不断扩大,这些应用正逐
智能规划是人工智能研究领域的一个重要分支。智能规划问题是一种关于动作的推理问题,即从某个特定问题的初始状态出发,寻找一个动作序列,使之能到达目标状态。规划系统可运用不
图像处理技术是信息处理领域中的一项热门技术,在计算机视觉、地球资源勘测、气象信息等领域得到广泛的应用。随着人们对图像信息应用需求的扩大和计算机技术的飞速发展,提高