一种乱序数据流上的偏倚抽样算法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:zilong2006min
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
抽样是生成和维护数据流概要结构的常用方法.乱序数据流中,延时到达的数据通常被丢弃,从而会降低聚集运算的精度.提出一种新的利用双时间戳进行偏倚抽样的方法,通过所设计的衰减函数确定数据流元组的权重,根据该权重进行抽样,不仅可以保证将最新产生的数据抽中,保留在滑动窗口内,还可以保证部分重要的延时数据不被丢弃.利用平衡二叉树存储滑动窗口内数据流元组的权重,以提高数据流操作的响应时间.实验结果表明根据双时间戳计算出的数据权重更能反映数据的实时性和代表性;与顺序结构相比,利用平衡二叉树可提高最小权重的查找速度,流数据
其他文献
P2P流媒体cache是一种有效减少带宽开销、提高对象利用率的技术,通常采用FIFO,LRU等算法置换内容.然而,流媒体不同于web对象,P2P网络也有别于客户/月良务器模式.在分布式应用中这些
定位技术是无线传感器网络中关键的基础支撑技术,目前提出了许多静态网络的节点定位算法,移动无线传感器网络的定位研究相对较少.针对定位节点和参考节点随机运动的网络模型,提出
国有企业作为一种社会组织,具有与私营企业和外资企业截然不同的目标定位,不仅具有经济目标,还具有社会目标。该文首先基于国有企业社会责任的发展历程,探讨了国有企业经济目