【摘 要】
:
国内企业信息化建设为企业业务的展开和效率的提高带来了不可磨灭的贡献。随着站点访问量的增多,服务器负荷增加,导致页面访问延迟增加,影响了企业的工作效率,Web日志挖掘技
论文部分内容阅读
国内企业信息化建设为企业业务的展开和效率的提高带来了不可磨灭的贡献。随着站点访问量的增多,服务器负荷增加,导致页面访问延迟增加,影响了企业的工作效率,Web日志挖掘技术为这些问题提供了解决方案。通过对Web日志进行有效的数据挖掘,发掘隐藏在日志数据背后的规律和模式,有利于网站设计人员掌握用户的喜好和访问习惯,从而优化核心页面集代码,改善Web站点结构及页面间的超链接结构,改进站点整体性能。本文在查阅国内外大量关于Web日志挖掘文献资料的基础上,结合中交天津航道局有限公司(以下简称天航局)的实际需求,讨论了针对天航局的网站访问分析系统的设计与开发,给出了系统的物理体系结构、软件体系结构、系统总体的功能设计和数据库设计。通过对经典FP-Growth算法进行分析,提出改进的FP-Growth算法,经过性能比较,指出改进算法的性能在时间上得到了提高。通过对基于关联矩阵的聚类算法进行分析,提出改进的用户矩阵聚类算法,经过性能的比较,指出了改进算法的性能在时间和空间上的提高。在算法研究的基础上,本文进一步详细介绍了系统的Web日志预处理模块、基本分析模块、模式发现模块的设计与实现,并使用该系统对真实的服务器日志文件进行挖掘,给出了分析结果。该系统使用.NET技术开发,作为天航局Web日志的分析工具,目前已投入使用,取得了很好的效果。通过对Web日志挖掘技术的继续研究,企业应用的不断深入,本系统可进一步完善和提高。
其他文献
OOSD技术能够较好的解决核心关注点的问题,但是对于横切关注点的处理以及如何响应软件需求的多变性,仍然具有局限性。而AOSD技术正是针对这一问题而被提出的。AOSD技术是面向
新研发的处理器越来越多地加入SIMD向量指令集,增强其数据并行处理能力。无锡江南计算所研发的国产处理器神威也搭载了SIMD向量处理单元。然而,国产处理器平台上应用匮乏,三
随着互联网技术的迅速发展,互联网上的数据类型日益多样,应用的种类也日趋复杂。单一种类的传统关系型数据库或者NoSQL数据库已经无法满足数据的各类存储处理需求。而在为了
随着互联网的发展,以利益为驱动的有组织网络犯罪在全球日渐猖獗。这些犯罪活动包括网络盗窃、诈骗和攻击破坏,窃取个人敏感信息和国家秘密信息等,严重威胁我国互联网的安全
随着Android智能手机的迅速普及,Android操作系统的安全性越来越受到关注。然而Android系统的开放性导致其存在版本碎片化以及生态系统不完善等问题。这些问题的存在使得针对A
随着面向服务的体系结构(SOA)的发展,网络中服务如何有效的复用已经成为研究热点,在流程级的服务组合方式中以BPEL方式更受到工业界的广泛支持。本文研究BPEL图形化的服务组
随着计算机网络的日益普及,它与人们日常生活的关系越来越密切。但是网络是一把双刃剑,它给我们带来便利的同时,也给我们带来了诸多问题。在众多的问题当中,网络安全是首要问
随着科学、技术和社会经济的发展,人们对计算机处理能力提出了更高的要求,特别是在基因工程、气象等大规模科学计算领域。理论上,问题的并行求解是一种有效的解决方案。然而,
基于构件的软件开发是解决软件危机的有效途径,其中构件库具有非常重要的作用,在构件库中,构件的描述和分类方式以及检索方法是构件库的核心功能,传统的构件描述与检索方式,
随着计算机软硬件技术的发展,三维动画在计算机仿真,计算机视觉,三维重建等在各领域越来越广泛的应用。为了获得逼真的视觉效果,一方面需要网格模型的细化程度越老越高,另一