Web日志挖掘应用研究

来源 :桂林理工大学 | 被引量 : 0次 | 上传用户:lvjieidd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着Internet技术的发展,WWW的应用也越来越多,Web站点越来越普及。在当前竞争激烈的网络经济中,只有赢得用户才能获得竞争中的优势。客户浏览行为的数字化,使得通过收集大量用户浏览行为数据来深入研究客户行为变为可能。如何利用这个机会,从这些“无意义”并且繁琐的数据中得到有价值知识和信息成为目前面临的最紧要的问题之一。为了解决这个问题Web数据挖掘技术诞生了。 本文介绍了Internet的发展状况及Web数据挖掘的产生背景,系统地阐述了数据挖掘技术与Web数据挖掘的思想、理论、技术、方法和策略,对Web日志数据挖掘过程及其中各环节的关键技术进行了深入的探讨,重点研究了Web日志挖掘的数据预处理技术和关联规则及基于关联规则的算法。 Web日志数据预处理方面,在分析比较各种方法基础上,设计出相关数据库表,并给出了简明清晰的算法实现。在关联规则及基于关联规则算法研究方面,本文分析了经典的基于关联规则的挖掘算法Apriori的特点,找出算法存在的不足,并对其进行了改进和优化,使其具有更高的效率。最后对Web服务器的日志记录进行挖掘实验,得到较为理想的结果。
其他文献
决策是管理过程中经常发生的一种活动,企业或组织发展的优劣成败关键在于高层决策者在面临复杂问题时所做出决策的正确与否。随着信息化时代的到来,决策者们越来越需要利用计算
图像超分辨率技术是一种基于信号处理方法获得较高分辨率图像的技术。它以若干模糊、有噪、频谱混叠的低分辨率图像为输入,通过信号处理技术融合出一幅高分辨率图像,因而在视
通信技术、嵌入式技术、传感器技术的飞速发展和日益成熟,使得无线传感器网络成为当前的一个研究热点。与传统网络相比,传感器网络具有以下特点:节点分布极其稠密且数目很大;
近年来,P2P(peer-to-peer)技术成为人们研究和关注的焦点,以Napster、Gnutella、BT、MSN、pplive为代表的P2P应用软件日益流行。信息共享是其最为常见的一种应用。在P2P共享
随着计算机图形学的发展,虚拟现实技术逐渐成为研究的热点和焦点。作为虚拟现实技术的重要组成部分,三维人脸建模有着越来越广泛的应用。目前该技术被广泛应用于影视制作、游
随着互联网技术的发展,Email已日益成为人类日常生活中必不可少的通信方式之一。人们之间的Email通信产生了大量的通信数据,从这些数据中挖掘出人类社会的社群结构并且分析社
随着网络使用的普及以及信息技术的不断进步,Web软件已成为一种主流的应用模式,如何确保Web软件的可靠性显得越来越重要。Web软件的特征是:用户数量大、代码量大、页面众多且
基于动态信息的城市交通诱导策略(简称为:路径诱导策略)是智能交通系统(IntelligentTransportation Systems,简称ITS)研究的一个重要方面,旨在通过向驾驶员提供基于实时交通信息
随着国际交流的日益频繁,翻译学学科地位不断提升,互联网搜索引擎辅助翻译得到不断的发展。传统的搜索引擎是基于关键词匹配的方式来进行信息检索,但是各个国家的自然语言中
基因识别是指采用生物学实验或计算机等手段来识别DNA序列上的具有生物学特征的片段,是生物信息学的一个重要分支。启动子是DNA序列上的一段重要的基因调控序列,标志着转录起