Web访问挖掘研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:abckidscba
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文研究web访问挖掘的主要目的是获取用户访问web的目标、兴趣和偏爱等行为模式,以此来改进web站点的结构和web提供服务的方式,实现站点的自动化管理和信息个性化服务,从而帮助用户更容易地获取所需信息.web访问挖掘对于电子商务也有重要意义:可以提高客户关系管理CRM(customer relationship management)的质量;可以帮助进行商业决策和安全管理;通过个性化服务,可以实现电子商务的最终目标——one to one的行销策略.该文所做的研究工作主要有:(1)深入讨论了web访问挖掘中,数据准备阶段遇到的各种问题,给出了一种识别用户访问事务的简单、易行的方法.(2)用户浏览web时,有些页面浏览频率会相当高,如站点首页、嵌有很多超链的导航页等,因而对用户访问事务数据进行关联规则挖掘时,就会产生组合爆炸,发现过多的规则而难以理解,该文给出了带约束关联规则的快速挖掘算法,解决了组合爆炸问题,并使得提交用户的规则有意义更清楚.(3)讨论了基于广义后缀树的访问事务数据多功能挖掘方法.基于广义后缀树,能够快速挖掘用户浏览web的关键路径;计算用户浏览web页面的可达集和可达概率;基于发现的关键路径,给出了对海量日志数据聚类的CWKP算法,该算法解决了现有聚类模型忽略用户浏览web的有序、连续、重复特性及聚类维数过高的缺点,并且,基于广义后缀树的路径发现,不需要关联规则频繁侯选集的计算,因而速度更快,算法具有更好的伸缩性能.(4)对于发现的模式,研究了在个性化服务,站点的组织、自动调整和重构,电子商务等领域的应用方法.对于个性化服务,着重讨论了两种方法:基于推荐的方法和基于Petri网方法.这两种方法,都不需要用户的参与协作,完全是自动的.基于Petri网方法,具有直观性和不需要反复计算推荐集合的优点,而且Petri网能很自然的描述web中的多内容并发显示和并发浏览.
其他文献
本文针对电信储值卡支付业务中对数据安全性要求高,数据处理的实时性要求高的问题,进行了分析,最后采用了交易中间件技术作为解决这一问题的方案。 随着计算机软硬件技术迅速
随着计算机技术的发展,企业在信息化的过程中,难以保持一个统一的技术平台,因此,企业信息资源常常由不同的操作系统、不同的编程语言、不同的技术模型、不同的数据库系统组成。将
该文作者曾亲自参与南开太阳公司IC卡智能水表信息管理系统和北京301医院病人订餐系统的设计与实现.针对在这两个系统开发过程中所发现的开发人员对软件工程的认识、开发方法
该文利用数理统计、拓扑、符号动力学等数学原理及现代金融理论、小波理论相结合的新方法一计算机实验数学的方法,研究基于金融领域的非线性复杂系统的混沌分形演化,形成了以
随着信息技术的发展,数据仓库在许多领域发挥了越来越重要的作用。面对当今世界中逐渐增多的数据和信息,人们希望以更低的成本、更快的速度做出及时、准确的决策。业务智能化系
传统市场调查方法和当前的网络市场调查方法都存在着种种不足,为了克服现代市场调查方法的缺陷,该文将现代密码学和市场调查相结合,设计了两种基于Mobile Agent的匿名网络市
该文讨论的是一类限制在欧式平面上的NP-Hard问题,这类问题可以称为"平面距离和优化问题".该文以实际问题为例介绍这种具有通用意义的近似方案设计技术.该文先阐述随机平面分