Web访问挖掘研究

来源 :东南大学 | 被引量 : 0次 | 上传用户：abckidscba

【摘要】

：

该文研究web访问挖掘的主要目的是获取用户访问web的目标、兴趣和偏爱等行为模式,以此来改进web站点的结构和web提供服务的方式,实现站点的自动化管理和信息个性化服务,从而

【作者】

：

宋爱波

【机构】

：

东南大学

【出处】

：

东南大学

【发表日期】

：

2003年期

【关键词】

：

数据挖掘 web访问挖掘个性化站点管理 Petri网

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

该文研究web访问挖掘的主要目的是获取用户访问web的目标、兴趣和偏爱等行为模式,以此来改进web站点的结构和web提供服务的方式,实现站点的自动化管理和信息个性化服务,从而帮助用户更容易地获取所需信息.web访问挖掘对于电子商务也有重要意义:可以提高客户关系管理CRM(customer relationship management)的质量;可以帮助进行商业决策和安全管理;通过个性化服务,可以实现电子商务的最终目标——one to one的行销策略.该文所做的研究工作主要有:(1)深入讨论了web访问挖掘中,数据准备阶段遇到的各种问题,给出了一种识别用户访问事务的简单、易行的方法.(2)用户浏览web时,有些页面浏览频率会相当高,如站点首页、嵌有很多超链的导航页等,因而对用户访问事务数据进行关联规则挖掘时,就会产生组合爆炸,发现过多的规则而难以理解,该文给出了带约束关联规则的快速挖掘算法,解决了组合爆炸问题,并使得提交用户的规则有意义更清楚.(3)讨论了基于广义后缀树的访问事务数据多功能挖掘方法.基于广义后缀树,能够快速挖掘用户浏览web的关键路径;计算用户浏览web页面的可达集和可达概率;基于发现的关键路径,给出了对海量日志数据聚类的CWKP算法,该算法解决了现有聚类模型忽略用户浏览web的有序、连续、重复特性及聚类维数过高的缺点,并且,基于广义后缀树的路径发现,不需要关联规则频繁侯选集的计算,因而速度更快,算法具有更好的伸缩性能.(4)对于发现的模式,研究了在个性化服务,站点的组织、自动调整和重构,电子商务等领域的应用方法.对于个性化服务,着重讨论了两种方法:基于推荐的方法和基于Petri网方法.这两种方法,都不需要用户的参与协作,完全是自动的.基于Petri网方法,具有直观性和不需要反复计算推荐集合的优点,而且Petri网能很自然的描述web中的多内容并发显示和并发浏览.

其他文献

电信储值卡系统交易中间件的设计实现

本文针对电信储值卡支付业务中对数据安全性要求高，数据处理的实时性要求高的问题，进行了分析，最后采用了交易中间件技术作为解决这一问题的方案。随着计算机软硬件技术迅速

学位

储值卡交易中间件面向对象技术UML

基于CORBA的企业信息资源集成研究

随着计算机技术的发展，企业在信息化的过程中，难以保持一个统一的技术平台，因此，企业信息资源常常由不同的操作系统、不同的编程语言、不同的技术模型、不同的数据库系统组成。将

学位

CORBA信息资源集成异构分布式组件

采用面向对象的软件工程方法开发MIS系统

该文作者曾亲自参与南开太阳公司IC卡智能水表信息管理系统和北京301医院病人订餐系统的设计与实现.针对在这两个系统开发过程中所发现的开发人员对软件工程的认识、开发方法

学位

软件危机面向对象MISRUPUMLXP

金融信息分形、小波结构分析与混沌动力学研究

该文利用数理统计、拓扑、符号动力学等数学原理及现代金融理论、小波理论相结合的新方法一计算机实验数学的方法,研究基于金融领域的非线性复杂系统的混沌分形演化,形成了以

学位

混沌分形小波理论混沌动力学

基于业务智能系统的实视图管理机制

随着信息技术的发展，数据仓库在许多领域发挥了越来越重要的作用。面对当今世界中逐渐增多的数据和信息，人们希望以更低的成本、更快的速度做出及时、准确的决策。业务智能化系

学位

业务智能系统数据仓库的演化实视图视图维护冗余视图

基于Mobile Agent的匿名网络市场调查协议的设计与实现

传统市场调查方法和当前的网络市场调查方法都存在着种种不足,为了克服现代市场调查方法的缺陷,该文将现代密码学和市场调查相结合,设计了两种基于Mobile Agent的匿名网络市

学位

匿名网络市场调查公平盲签名伪名电子投票Mobile Agent密码学

一种在欧式空间中设计NP-Hard问题多项式近似方案的新技术

该文讨论的是一类限制在欧式平面上的NP-Hard问题,这类问题可以称为"平面距离和优化问题".该文以实际问题为例介绍这种具有通用意义的近似方案设计技术.该文先阐述随机平面分

学位

近似算法近似方案计算机理论NP-Hard问题

Web访问挖掘研究

其他学术论文