数据挖掘在WWW上的实现技术

来源 :郑州大学 | 被引量 : 0次 | 上传用户:pt315311
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
WWW是一个开放的全球性的资源,它包含了海量的跟人类生活密切相关的数据。随着WWW上信息的爆炸性的增长,在如此大量的数据中发现有用的信息变得困难。而数据挖掘技术(Data Mining,简称DM)是从大量的数据中提取出隐藏在数据之后的有用的信息。因此,采用数据挖掘技术从WWW上智能地、自动地提取出有价值的知识,提高WWW的效率,具有十分重要的现实意义和广泛的应用前景。 本文首先简要论述了WWW发展的基本情况以及当前存在的一些问题。随后,论述了数据挖掘技术的基本概念、原理。在论述了数据挖掘技术理论之后,研究了数据挖掘技术在WWW上的应用,详细论述了Web内容挖掘和Web使用挖掘的内容、特点、存在的问题。接着,重点讨论了数据挖掘中的关联规则挖掘,论述了其基本概念、算法。在研究WWW、DM、Web DM、关联规则的基础上,提出了一种采用关联规则的方法解决网络拥塞问题,通过对服务器的访问日志进行挖掘,得到用户访问序列的关联规则,将这些规则应用到客户浏览,把用户随后最有可能访问的网页预先传送到用户本地,来提高访问速度。文中详细论述了该方法的实现方案、算法、运行的环境以及对该方法的分析。最后,对全文进行了总结。
其他文献
计算机辅助教学作为对传统教学模式的补充,计算机应用领域一个炙手可热的分支,在各个时期,随着相关技术的不断提高,表现出不断发展和自我完善的趋势,更融入了时代的特征。随着网络
随着能源技术的发展,太阳能作为一种清洁无污染的可再生能源,在新能源领域备受瞩目:太阳能发电技术有着广阔的发展前景,日益成为一个具有重要现实意义的研究课题。传统化石能源的使用带来的环境问题日益严重,太阳能的利用在一定程度上有利于生态环境的保护。近年来,光伏发电在太阳能发电领域占据着绝对的主导地位。在光伏电站的运行中,太阳追踪控制系统是整个光伏发电系统的重要组成部分,可以有效提高电站的太阳能利用率。因
Web技术与分布对象技术的有机结合,导致了整个应用系统的体系结构从过去流行的客户机/服务器主从结构向灵活的三级浏览器/服务器计算结构演变,从而产生了分布信息服务。分布信息