模糊和粗糙环境下的网络用户浏览模式研究

被引量 : 0次 | 上传用户:wcd_soft
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文从Web使用挖掘的序列分析和聚类分析中对Web日志进行分析研究,发现人们感兴趣的浏览模式。从Web日志中提取出的有用知识可被用于网站设计、分析系统性能以及网络通讯、理解用户的行为和动机,以及建立个性化的网站等。本文针对用户浏览模式的特点,就用户浏览模式的挖掘和聚类进行了深入的分析和研究,主要工作如下: 提出了基于Frequent Link and Access Tree(FLaAT)的用户浏览模式的挖掘算法,FLaAT存储了所有用户的浏览信息,在搜索用户偏爱模糊路径时考虑到了不同前缀的相同子路径的合并问题,使得挖掘信息更完整。 给出了模糊环境下使用语言最小支持度和偏爱度挖掘用户模糊偏爱浏览路径算法,网页上的浏览时间被刻画成模糊语言变量,这样所挖掘出的带模糊时间值的偏爱路径更能反映用户的兴趣和偏爱程度。此外,语言的输入输出控制更自然、更符合人的推理方式。 定义了模糊偏爱度概念,它和表示用户访问频度的支持度一起反映用户的兴趣和偏爱程度。同时给出了基于模糊偏爱度的用户浏览模式的有效挖掘算法。模糊偏爱度综合考虑了网页的权重、网页的相对访问频度和网页上的浏览时间,因而它更能体现用户的兴趣和偏爱。 设计了一种模糊的粗糙近似法用于对Web日志中的用户浏览模式进行聚类。在聚类过程中,每个用户浏览模式被表示成等长的模糊向量的形式,以表示该用户访问过的网页及网页上的模糊浏览时间,最后使用粗糙近似的方法对表示用户浏览行为的模糊向量进行聚类。 提出了模糊环境下基于粗糙k-均值的聚类方法。每个用户浏览模式都被转换成具有相等长度的模糊向量,然后对代表用户浏览特征的模糊向量使用粗糙k-均值进行聚类。 通过实例分析和相应实验测试,验证了本文所提出算法的有效性与合理性。
其他文献
<正> 外感失治、误治所致长期低烧是临床常见症,仲景称之为坏病。由于低烧不退,日久正衰,从而引起一系列变症,虽非疑难,但治疗颇为棘手,笔者有感于此,拟举7例,试陈一隅之见,
目的探讨通过末梢血和静脉血这两种不同采血方法进行血常规检验在临床中的应用。方法同时采集156例受检人员的末梢血和静脉血,通过血液分析仪检测血常规,对检测结果的差异性
本文通过分析指出,产后出血的预防及治疗应从早期产后出血的预防和晚期产后出血的预防及治疗几个方面着手,才能取得较好疗效。
<正> 我们是谁?我们从哪里来?我们要到哪里去?这些问题困扰着我们每个执著于生存和生活的人。我们试图沿着人类历史匆忙走过的脚印,寻找我们作为人的存在价值,无论做男人还是
美洲野牛很早就生活在北美大陆上,与印第安人拥有一个共同的家园,成为印第安人生活不可分割的重要组成部分,是印第安文化的象征。在经历了欧洲殖民侵略和西部开发之后,它们曾
<正>毛泽东的既定方针:"批判资产阶级反动思想"毛泽东对胡风事件的直接介入,是从1954年《〈红楼梦〉研究》批判"开始的。1953年,毛泽东在6月召开的政治局会议上,严厉批评了"
必然与自由的关系是人类活动的本原性结构,"自由是对必然的认识"绝不意味着人们在从事某种历史活动之前有一个现成的历史必然性可供认识,相反,任何一个具体的历史必然性都实
"庄周梦蝶"为历代学者所关注,但庄周为什么偏偏梦的是蝴蝶而非他物?学界鲜有探考。苗楚文化同源,苗族的蝴蝶崇拜,化蝶、梦蝶与生死观等对庄周有极大影响,庄周之所以梦的是蝴
<正>我是一名普通的小学教师,从教十余年来,常常为孩子们的天真无邪、纯洁透明而感动,常常被孩子们的聪明睿智、灵感百出而折服。因此,庆幸自己能远离世俗和孩子们朝夕相处,
期刊
当代大学生屡被传销组织所蒙骗,深陷其中而不能自拔。大学生为什么会轻而易举地成为传销组织的俘虏,高校应采取哪些行之有效的措施和对策。