基于数据流的关联规则算法研究与实现

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:liangjingyu1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的迅速发展和普及,分布式计算的研究在90年代后达到了高潮,目前,在Internet网上分布式计算已非常流行。分布式计算研究主要集中在分布式操作系统研究和分布式计算环境研究两个方面。在过去的20多年间出现了大量的分布式计算技术,如中间件技术、网格技术、移动Agent技术、P2P技术以及最近推出的WebService技术等。每一种技术都在特定的范围内得到了广泛的应用。但是,随着无线网络容量、带宽的增大,移动设备的快速发展和应用,开始提出了移动分布式的计算环境。移动挖掘正是在此基础上提出的。   移动挖掘的最大特点是面向数据流。移动设备资源有限以及数据流的高速、无限、随时间变化的特性给移动挖掘带来了挑战。因而,本文作如下研究,以解决在移动平台上的关联规则挖掘的问题。   1.充分利用FP-树的紧密性,在此基础上利用滑动窗口的近似策略,解决数据流高速性,无限性等特点,提出一个基于整个数据流历史频繁计数的数据流频繁模式算法DSM-FP1。   2.研究FP-Growth频繁模式生成过程,发掘内在并行性,提出一   个适合在移动分布式平台应用的数据流频繁模式挖掘算法DSM-FP2,充分利用移动计算平台上分散的计算能力;   3.在理论分析和实例分析的基础上,设计实现算法,再次通过实验验证所提出的两个算法的正确性和扩展性。与传统的关联规则算法相比较,在保持正确性的基础上,提高性能,稳定性和扩展性。   本文的研究意义在于通过对传统算法的改进,设计出适合移动环境的算法,对数据流挖掘进行有益的探索。
其他文献
今天,人脸检测的应用背景已经远远超出了人脸识别系统的范畴,在基于内容的检索、数字视频处理、视觉监测等方面有着重要的应用价值。人脸检测是自动人脸识别系统中的一个关键环
在时间规划中,时间模型是一个重要的概念。时间规划的算法均要建立在一定的模型之上。时间模型多种多样,各有特色,本文中的时间规划运算使用了时间矩阵模型,时间规划可以用矩
随着增值业务的复杂化和用户需求的多样化,人们需要快速的业务定义生成工具方便灵活地增加新业务,提供丰富多样的电信增值业务。本课题的工作是针对增值业务图形化业务流程定义
可缩放矢量图形ScalableVectorGraphics(SVG)是一种使用XML描述二维图形的语言。由于其各方面的优点,SVG文件格式成为网络传播图形信息的一种理想的文件格式。SVG文件记录了实
数据库技术发展迅速且得到了广泛应用,但在20世纪末,一种新的应用模型却对它提出了有力的挑战。这种名为流数据的应用模型广泛出现在众多领域,例如金融应用、网络监视、通信数据
随着软件工程普及,软件工程环境的重要性也日益显现。软件工程环境是软件工程学的组成部分,也是软件工程化的重要基础。在软件开发中,无论技术活动还是管理活动,都离不开环境的支
几何自动推理是让计算机模拟人脑来进行几何命题的证明,它是人工智能领域的重要研究课题。20世纪70年代,吴文俊先生就提出了定理机器证明的方法;随后,张景中院士在面积法的基础上
随着网络技术的迅速发展,网络安全在计算机网络中的应用起着越来越重要的作用。本文的工作主要是围绕着自适应智能防火墙体系结构的设计和仿真展开的,主要包括以下几个内容:
分布式虚拟现实中的虚拟环境是一个可以提供给参与者进行协同,以及共享物体的虚拟现实空间,在这种环境中参与者可以有很强的沉浸感,是目前的研究热点。这种技术已经在游戏,军
计算机网络时代,快捷廉价的数字传输手段为人们获取和交流信息带来了极大便利:然而,全透明的网络信息却又极易为非法分子盗版和篡改。作为数字产品版权保护和信息安全维护的