流数据频繁模式挖掘算法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:dengscc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统数据挖掘的对象是传统数据或静态数据,其来源于关系数据库、数据仓库和事务数据库里面的数据。现实世界和工程实践中产生了大量的流数据,这种数据不同于传统的静态数据,是一种具有实时、快速和连续到达特点的动态数据。由于流数据的上述特点,对其进行有效处理和挖掘遇到了极大的挑战,使得应用于传统数据挖掘的技术和方法不能很好的适应流数据。如何使用有限的内存空间和CPU的处理速度进行快速和近似的频繁模式挖掘是流数据挖掘的基本问题,具有非常重要的价值和实践意义。  近年来,在流数据中挖掘频繁项集是一个非常新的研究课题。以往的解决方法,大多是在挖掘频繁项集时使用一个固定的最小支持度。然而,在实际情况中,支持度阈值应该随用户需求和流数据的特点而改变。本文提出了一种名为VSSDM(Variable Support for Steam Data Mining)的算法,用于在流数据中以可变支持度挖掘频繁项集。本文使用概要向量结构SYV(Synopsis Vector)高度压缩并存储历史流数据。该算法可以让用户改变支持度阈值,找出自开始以来流数据中所有的频繁项集。
其他文献
乡土资源在高校思政教学中的创造性、灵活开发、融合与应用有利于提升高校思政教改成效.基于此,本文以高校思政教改中乡土资源的开发方式和应用路径为分析对象,尝试解读乡土
在业务需求不断增加的情况下,任务和数据密集型网络应用系统面临数据量迅速膨胀、数据形态不断扩张、用户种类不断增多的现状。根据数据操作特性对数据进行合理分割,并用合理的
Web Service作为一种新的分布式计算技术,凭借其平台无关性、消息导向性和协议可组性等特点,从出现以来就在工业界得到广泛认可,使世界上的很多个国际性组织研究和制定各种规
新闻具有的重要舆论导向作用是不容忽视的.记者在收集到各类社会新闻素材之后,应通过合理地归纳整理来将其撰写成新闻稿,然后通过媒体将以新闻为载体的一系列信息传递给新闻
篮球教学作为高职院校教学实施中较为重要的一项教学工作,在整个教学工作中占据着重要地位,要想提升高职院校篮球教学水平,必须按照高职院校篮球教学工作实施中的要求,将相应
在新媒体高效发展的背景下,传媒格局、生态发生了诸多转变,报纸深度报道也逐渐受到媒体、读者给予的双重“冷落”,陷入了生存发展的困境当中.对此,为了真正摆脱这一困境,重新
按照应用类型进行网络流量的分类对网络管理来说具有非常重要的意义。精确的分类可以帮助网络设备在拥塞时区分流量的优先级、进行流量整形、实现流量的诊断检测等等。同时,
随着移动通信网络的日益庞大,如何保证众多造价昂贵的精密设备正常运行,发挥通信网效益至关重要。科学技术的迅速发展,使通信设备的自动化性能有了很大提高,为通信系统的集中
我有幸与《新闻与写作》结下了志同道合的好缘分,有许多文章令我深长回味,常看常新。她是我工作中的好帮手。我原是一名教师,1991年调到县计生 I was fortunate enough to h
辅导员是高职院校思政教育工作的执行者,在思政教育中发挥着极为重要的作用.随着“微”时代的不断深入,如何做好高职院校的思政教育工作是现阶段辅导员面临的主要问题.因此,