论文部分内容阅读
随着互连网技术和电子商务的迅猛发展,Internet正在前所未有地改变着我们的生活。越来越多的商品交易和服务通过Web来进行,如何更好地适应市场的变化、更好地为顾客服务成为各个网站关注的热点。为了更好地解决经营者和顾客的关系,自适应站点成为当前网站设计研究的热点。越来越多的门户站点开始通过自适应网站应用系统向顾客提供有针对性的服务。 站点设计是一个复杂和困难的问题。传统的站点在把设计内容提交给网站服务器以后就不再改变它的设计。既使是数据库驱动的站点,它的设计也是预定义好,只是它的数据在动态改变。如何设计一个自适应站点成为网站设计的首要问题。 用户访问站点的日志文件为我们提供了一个观察用户与站点交互的机会。自适应站点通过观察用户的访问模式,自动改进站点的结构和表现形式以更加适合用户的需求。 本论文首先讨论了Web日志挖掘预处理中的各步骤:数据抽象、数据清洗、用户与会话识别、访问路径补全,给出了每一步骤的算法实现;并特别讨论了含有frame页的日志数据预处理过滤算法。其次讨论了构建自适应站点技术,包括日志数据聚类挖掘、用户访问模式学习、站点结构转化与呈现等;提出了单用户日志访问模型,给出了用户模型在线学习算法、索引页面综合算法、站点结构转化及呈现算法等。最后给出了自适应站点系统模型,包括:Web数据挖掘算法表示装配模块、Web日志数据挖掘处理模块、Web日志挖掘模块、站点结构转化及其呈现模块、系统管理配置模块等,并设计实现了基于该系统模型的实验原型系统AWSS2004。