论文部分内容阅读
随着P2P计算模式的兴起和Internet端系统计算能力的迅速增强,原先被忽视的终端用户设备成为一种宝贵的资源。如何充分利用这些终端用户设备,在动态的P2P网络环境中对海量数据进行查找引起了很大的关注。
聚合Top-k查询就是查找聚合运算后结果值最高(或最低)的κ个对象。目前Top-k查询已经在Web搜索引擎中被广泛地使用并获得了巨大的成功。在分布式环境中,评价Top-k算法的性能标准是网络延迟和带宽消耗。但是现有的一些Top-k算法大都只适用于集中式网络,当这些算法被应用于分布式网络中时,它们并没有考虑到中间结果的合并,只是直接把中间结果一步一步上传给查询节点,所以不能很好地满足Top-k算法的性能标准。
本文提出了一个解决分布式网络中Top-k查询的新方法,BloomFilter HistogramContainer算法(简称为BHC算法)。BHC算法充分利用到分布式网络中的每个节点的计算能力,它不仅网络延迟小,网络带宽花费少,而且能够运行在任何结构的分布式网络中。本文将基于一个树型拓扑网络来说明如何使用局部直方图和BloomFilter信息来优化查询处理,以及如何在中间节点进行部分结果的合并。
实验评估和性能分析表明BHC算法在网络带宽消耗和查询响应时间方面要优于其他同类方法。从实验结论中可以看出,在BHC算法中使用直方图和BloomFilter能够有效地提高查询速度,并且能节省大量的带宽。