基于计数的数据流频繁项挖掘算法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户：fgq861218

【摘要】

：

挖掘数据流的频繁项已受到广泛关注，经典的频繁项挖掘算法尽管能够比较好地找到频繁项，但对频繁项频数的估计往往存在较大误差．SRoEC（segment rotative efficient count），SReEC（segm

【作者】

：

祝然威王鹏刘马金

【机构】

：

复旦大学计算机科学技术学院

【出处】

：

计算机研究与发展

【发表日期】

：

2011年10期

【关键词】

：

频繁项 Top—K 数据流数据挖掘频数估计 words frequent item Top-K data stream data mining freque

【基金项目】

：

高等学校博士学科点专项科研基金项目（20090071120092）,IBMCRLUR基金项目（JSA201007005）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

挖掘数据流的频繁项已受到广泛关注，经典的频繁项挖掘算法尽管能够比较好地找到频繁项，但对频繁项频数的估计往往存在较大误差．SRoEC（segment rotative efficient count），SReEC（segmentreserve efficient count）和RFreq（reserv efrequent）算法针对该问题，继承基于计数的算法思想，将计数器进行划分并定义相应的操作，以期提高频数统计准确度并减小“噪音”影响．实验和数据分析表明，这些算法不仅能够保证频数超过阈值的数据项都能被找到，

其他文献

熵指数约束的模糊聚类新算法

针对基于模糊C均值聚类(fuzzy C-means,FCM)算法框架的竞争聚集聚类(competitive agglomeration,CA)算法中模糊指数m被限定为2的问题,提出了一种更为普适的模糊聚类新算法.该算法首先在FCM算法框架的基础上引入熵指数约束条件,构造了基于熵指数约束的模糊C均值聚类(entropy index constraint FCM,EIC-FCM)算法,成功地将模糊指数

期刊

竞争聚集模糊指数熵指数熵指数约束模糊聚类

On the Identity of Ishmael in Moby Dick

Moby Dick is a retrospective novel about life at sea as well as a vast philosophical allegory of life in general.The novel begins with a famous statement"Call m

期刊

IshmaelMobyDICKIDENTITYIshmaelMoby Dickidentity

基于计数的数据流频繁项挖掘算法

其他学术论文