基于计数的数据流频繁项挖掘算法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:fgq861218
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
挖掘数据流的频繁项已受到广泛关注,经典的频繁项挖掘算法尽管能够比较好地找到频繁项,但对频繁项频数的估计往往存在较大误差.SRoEC(segment rotative efficient count),SReEC(segmentreserve efficient count)和RFreq(reserv efrequent)算法针对该问题,继承基于计数的算法思想,将计数器进行划分并定义相应的操作,以期提高频数统计准确度并减小“噪音”影响.实验和数据分析表明,这些算法不仅能够保证频数超过阈值的数据项都能被找到,
其他文献
针对基于模糊C均值聚类(fuzzy C-means,FCM)算法框架的竞争聚集聚类(competitive agglomeration,CA)算法中模糊指数m被限定为2的问题,提出了一种更为普适的模糊聚类新算法.该算法首先在FCM算法框架的基础上引入熵指数约束条件,构造了基于熵指数约束的模糊C均值聚类(entropy index constraint FCM,EIC-FCM)算法,成功地将模糊指数
Moby Dick is a retrospective novel about life at sea as well as a vast philosophical allegory of life in general.The novel begins with a famous statement"Call m