数据挖掘在WWW上的实现技术

来源 :郑州大学 | 被引量 : 0次 | 上传用户:pt315311
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
WWW是一个开放的全球性的资源,它包含了海量的跟人类生活密切相关的数据。随着WWW上信息的爆炸性的增长,在如此大量的数据中发现有用的信息变得困难。而数据挖掘技术(Data Mining,简称DM)是从大量的数据中提取出隐藏在数据之后的有用的信息。因此,采用数据挖掘技术从WWW上智能地、自动地提取出有价值的知识,提高WWW的效率,具有十分重要的现实意义和广泛的应用前景。 本文首先简要论述了WWW发展的基本情况以及当前存在的一些问题。随后,论述了数据挖掘技术的基本概念、原理。在论述了数据挖掘技术理论之后,研究了数据挖掘技术在WWW上的应用,详细论述了Web内容挖掘和Web使用挖掘的内容、特点、存在的问题。接着,重点讨论了数据挖掘中的关联规则挖掘,论述了其基本概念、算法。在研究WWW、DM、Web DM、关联规则的基础上,提出了一种采用关联规则的方法解决网络拥塞问题,通过对服务器的访问日志进行挖掘,得到用户访问序列的关联规则,将这些规则应用到客户浏览,把用户随后最有可能访问的网页预先传送到用户本地,来提高访问速度。文中详细论述了该方法的实现方案、算法、运行的环境以及对该方法的分析。最后,对全文进行了总结。
其他文献
该文提出了基于CTI和COM技术结合的新型呼叫中心解决方案,并且已在贵州电信行业广泛应用,取得了很大的成功.该文的主要工作如下:1.综合比较了华为、Lucent等著名厂商的呼叫中
计算机辅助教学作为对传统教学模式的补充,计算机应用领域一个炙手可热的分支,在各个时期,随着相关技术的不断提高,表现出不断发展和自我完善的趋势,更融入了时代的特征。随着网络
该文探讨了企业过程重组在企业资源管理系统中的应用,通过分析当前企业过程重组的软件和中国中小企业的管理现状,我们认为动态企业建模,给企业过程重组的实施带来了方便条件,
随着市场经济和计算机技术的发展,动态分布式ERP软件成为ERP领域的一个新的研究热点.持久数据的动态性、分布性是动态分布式ERP软件的基础.该文重点研究持久数据的动态性、分
该课题主要针对网络通信过程中数据安全与保密方法进行研究,对提高计算机网络通信的安全与保密程度,促进网络通信的应用具有很强的实际意义.该文首先对信息安全的研究现状及
随着能源技术的发展,太阳能作为一种清洁无污染的可再生能源,在新能源领域备受瞩目:太阳能发电技术有着广阔的发展前景,日益成为一个具有重要现实意义的研究课题。传统化石能源的使用带来的环境问题日益严重,太阳能的利用在一定程度上有利于生态环境的保护。近年来,光伏发电在太阳能发电领域占据着绝对的主导地位。在光伏电站的运行中,太阳追踪控制系统是整个光伏发电系统的重要组成部分,可以有效提高电站的太阳能利用率。因
Web技术与分布对象技术的有机结合,导致了整个应用系统的体系结构从过去流行的客户机/服务器主从结构向灵活的三级浏览器/服务器计算结构演变,从而产生了分布信息服务。分布信息
针对动态路由策略实现的过程中遇到的问题,该文引入Tabu搜索算法解决了路由方案问题,使得系统满足动态路由实现所要求的实时性.实验表明,Tabu搜索算法比系统原来的遗传算法在
该课题充分利用了Internet的广域性,Java及其相关技术的面向对象和跨平台的特性以及数据库的海量数据存储能力和其访问的安全特性,并结合了基于web服务的三层体系结构实现了
该文提出一种在监控过程中逐步调整各个页面检测频度的方法.这种方法根据在以往的监控过程中所获得的页面变化情况,估计页面变化的未来趋势,不断地修正对该页面进行检测的频