Web使用挖掘中若干问题的研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:Silly728
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文通过理论分析加以辅助实验,围绕Web使用挖掘中的几个主要问题进行了研究。   本文首先对Web使用挖掘中各个阶段进行了全面的分析,尤其对数据预处理中用户会话和用户事务的识别技术进行了深入的探讨和分析;详细研究了Web使用挖掘的有关理论及应用空间;展望了Web使用挖掘未来的研究方向。   本文将Web使用模式的范围由单一的事务内扩展到事务间。Web事务间的关联规则描述的是不同的Web事务之间存在的相互关系,提出了利用频繁项目集的闭合性质来解决事务间关联规则的挖掘,给出必要的扩展定义以及设计和实现了一个高效的算法CFCIM;提出了一个基于相关性分析的关联分类算法ACBCA,直接从训练数据集中抽取k个最好的正相关和负相关规则用于分类,从而避免复杂的阈值指定和偏见规则等问题;深入研究了逆k-最近邻的理论基础,并吸取了索引树对多维数据集整体特征良好的表达能力,提出了基于多维向量的动态索引结构RkNNTree及其检索方式RkNNQuery算法。   本文提出一个新的基于项目的协作过滤推荐算法CFBIS,利用当前对象的影响集来提高该资源的评价密度。CFBIS同时结合当前对象的k个最近邻和k′个逆最近邻来为当前对象产生推荐,并为这种新的推荐机制定义了计算预测值的方法,实验结果证明,这种方法有效的缓解了数据集稀疏的问题。
其他文献
近年来,嵌入式技术发展迅速,在工业控制、银行、医疗等许多领域大显其能。同时,嵌入式设备也逐渐走入普通家庭,掌上电脑、PDA、多功能手机等越来越普及。随着网络技术的不断
  本文使用的基于GM(1,1)模型的灰色预测控制器的主要特点是仅需要少量的被控对象模型结构的信息。  本文结合液位对象纯滞后的控制特点,分析了用灰色预测控制算法解决这类
数据仓库和OLAP(Online Analytical Processing)系统允许快速访问和整合海量数据进行分析。从这个意义上讲,数据仓库是BI(Business Intelligence)必不可少的工具。尤其是Hadoo
随着科学技术的不断发展,机械设备变的越来越复杂,自动化水平越来越高,设备在现代工业生产中的作用和影响也越来越大,并且与设备有关的费用越来越高。机器在运行中发生的任何
在现有的CAD 系统中,由于上个世纪下半叶在计算机图形学领域取得的巨大进展,在图形设计和实体造型方面已经基本能够满足设计的需要。但新技术的发展突飞猛进,随着网络技术特
神经网络在数据挖掘的应用中主要存在两个问题,一是训练时间过长;二是获得的知识难以理解和表示。神经网络中的规则提取方法是解决“黑箱问题” 的有效手段,论文分析了基于结构
网格是一个稳定的环境,它将分散在一个较大范围内的由不同组织管理的各种仪器设备、计算资源和信息资源集中在一起,允许应用软件方便地进行访问.计算机网络的迅速发展和网络
随着工业技术的发展,在人-机-环境这个系统中,人的因素越来越引起大家的重视。人的因素已经成为工业产品设计的主要因素甚至决定因素,在设计及产品的测试过程中需要“以人为
随着计算机技术的飞速发展,计算机已经逐渐成为人们生活不可或缺的一部分,与此同时,恶意软件的数量在迅速增长,其反分析、反检测技术也不断增强,这给安全软件的设计和实现提出了更
本文介绍了文本分割的历史发展和现状,对当前文本分割领域的主流方法进行了讨论,并结合文本分类任务对文本分割任务中所存在的问题及典型的解决方案进行了介绍。因为统计模式