论文部分内容阅读
挖掘数据流的频繁项已受到广泛关注,经典的频繁项挖掘算法尽管能够比较好地找到频繁项,但对频繁项频数的估计往往存在较大误差.SRoEC(segment rotative efficient count),SReEC(segmentreserve efficient count)和RFreq(reserv efrequent)算法针对该问题,继承基于计数的算法思想,将计数器进行划分并定义相应的操作,以期提高频数统计准确度并减小“噪音”影响.实验和数据分析表明,这些算法不仅能够保证频数超过阈值的数据项都能被找到,