论文部分内容阅读
数据流具有无限增长的特征,目前的计算系统无法在线处理整个数据集,只能在有限空间内对部分数据进行处理。为了能够得到尽可能合理的结果,数据流系统常常采用单调递减函数由数据的时间戳来确定数据的权值,根据权值选择数据。广泛使用的单调函数是指数函数和多项式函数,但它们存在衰变速度太快或太慢等问题。提出一种新的时间衰变模式——使用余弦函数的局部衰变速度介于指数和多项式之间的特征来确定数据的权值。实验结果显示相对于指数和多项式衰变,局部余弦衰变具有衰变速度合理、参数易于确定、适用于乱序数据流等优势。