基于粗糙集的Web用户模式挖掘研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:grasskeeper
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet网站正在从“以网站为中心”向“以用户为中心”发展,因此Internet网站的发展趋势是个性化网站(Personalization Web Site)。个性化网站应尽可能地迎合每个用户的浏览兴趣并且不断调整自己来适应用户浏览兴趣的变化。具体的说就是,任何一个网站的老用户,当他在访问个性化网站的时候,总有一种感觉,那就是:好象整个网站都是为他设计的,一切都是那么熟悉,而且都是自己感兴趣的东西。任何一个网站的新用户,当他在访问个性化网站的时候也有一种感觉:网站特别友好,很容易找到自己感兴趣的东西。针对目前Web站点多、信息量大而杂的特点,如何使用户在庞大的网络数据资源中很容易地找到自己真正需要的东西成为当前研究的重点和热点。由于Web资源的爆炸性增长,对于已经把Web转化为关键发展工具的信息网站(特别是电子商务网站)来说,运用数据挖掘技术获取用户的访问模式对于网站的生存是十分有利的。本文把数据挖掘技术应用于信息化网站,得到Web用户访问模式,并利用用户访问模式及时地对网站的内容和结构进行完善和改进,以满足用户的个性化需求。目前,国内外对Web用户模式挖掘的研究主要集中在对用户浏览路径的研究。而本文是从另一个角度(用户访问过程中关注的内容)进行考虑,将每个网页细分为一个或多个概念(用户关心的通常是其中很少的一个或几个概念)。论文中首先根据网站拓扑结构生成网站的概念树。其次,引入一种从事务的浏览路径页面序列到事务的浏览路径概念序列的转换方法和根据页面浏览时间估算概念浏览时间的方法。再利用基于粗糙集理论中的可变精度模型(VPRS)的兴趣识别算法获得用户概念模式,并将其转换为用户的兴趣概念树,从而为网站的个性化推荐服务。最后,初步实现了一个个性化网站模块的设计。
其他文献
该文主要的工作和研究由以下几部分组成:一、针对传统的信息融合模型与具体应用相关的不足,提出了一种具有普遍意义下的信息融合模型.二、分析研究了几种神经网络的融合性能.
在当前数字信息技术高速发展的后PC(Post-PC)时代,随着嵌入式系统应用的深入,出现了各种各样的通用和专用嵌入式实时操作系统.如何测试嵌入式实时操作系统保证嵌入式系统的质
随着计算机技术的发展,自动化控制已在工业生产领域中得到了广泛应用,为达到高效、节能、延长机组使用寿命的目的,大型制冷工程常采用多台小功率制冷机组并联替代单台大功率制冷机组的设计方案。与单台制冷机组相比,制冷并联机组的控制模型复杂、控制过程难度大,世界上制冷并联机组的自动化控制系统尚处于实验阶段、成型产品不多见,控制系统仍基本依靠人工方式实现。由此造成许多显而易见的问题:难于调整平衡制冷并联机组中各
通常,几何定理的证明是依据公理系统,按一定的逻辑规则演绎地进行。对于每一个定理,其证明的方法都是不同的,一种方法只适用于一个定理,没有通用的证明方法或指导思想适合于
在研究现有控制流分析理论的基础上,该文采用基于图论的方法求取控制依赖关系,该方法具有很好的可扩展性和通用性.它主要是通过将控制流图转化成后必经结点树,再根据后经结点
本文首先叙述了数据挖掘软件的发展历史,分析每一阶段软件产品的优缺点,并将其与MSMiner(一个由中科院计算所信息智能国家重点实验室开发的多策略数据挖掘平台)相比较,以此展示
随着网络技术的高速发展,利用广泛开放的网络环境已成为时代发展的趋势,但网络在提供开放和共享资源的同时也不可避免地存在安全隐患。 在国内外网络不安全的严峻形势下,研究
学位
互联网环境下,文本集呈现容量大、语义分布不均和变化速度快等特点。传统文本挖掘技术大多基于浅层架构,并以单一的词包方式进行全局语义建模,限制了它们在实际互联网应用中的性
本文简单而系统的介绍了共享虚拟存储系统(又称软件分布式共享存储系统,简称软件DSM),对其通信行为进行了较深入的分析。在可扩展一致性接口 SCI(Scalable Coherent Inter