P2P网络中聚合Top-k查询优化技术研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:woailzm002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着P2P计算模式的兴起和Internet端系统计算能力的迅速增强,原先被忽视的终端用户设备成为一种宝贵的资源。如何充分利用这些终端用户设备,在动态的P2P网络环境中对海量数据进行查找引起了很大的关注。 聚合Top-k查询就是查找聚合运算后结果值最高(或最低)的κ个对象。目前Top-k查询已经在Web搜索引擎中被广泛地使用并获得了巨大的成功。在分布式环境中,评价Top-k算法的性能标准是网络延迟和带宽消耗。但是现有的一些Top-k算法大都只适用于集中式网络,当这些算法被应用于分布式网络中时,它们并没有考虑到中间结果的合并,只是直接把中间结果一步一步上传给查询节点,所以不能很好地满足Top-k算法的性能标准。 本文提出了一个解决分布式网络中Top-k查询的新方法,BloomFilter HistogramContainer算法(简称为BHC算法)。BHC算法充分利用到分布式网络中的每个节点的计算能力,它不仅网络延迟小,网络带宽花费少,而且能够运行在任何结构的分布式网络中。本文将基于一个树型拓扑网络来说明如何使用局部直方图和BloomFilter信息来优化查询处理,以及如何在中间节点进行部分结果的合并。 实验评估和性能分析表明BHC算法在网络带宽消耗和查询响应时间方面要优于其他同类方法。从实验结论中可以看出,在BHC算法中使用直方图和BloomFilter能够有效地提高查询速度,并且能节省大量的带宽。
其他文献
随着Internet的广泛应用,网络教育越来越受到人们的重视。由于网络教育中教师和学生在空间上是分离的,沟通与交流就显得尤为重要。因此,答疑系统成为网络教学中的重要组成部分。
面对越来越多的数据,如何利用这些海量数据,并从中提取出对企业的生产经营活动有用的信息,数据仓库技术应运而生。相对于钢铁企业生产统计来说,包括炼钢工序、热轧工序、轨梁工序
高维数据索引机制是医学图象库基于内容检索的重要课题。作者在“国家数字化医学影像设备工程技术研究中心”的资助下,从事此方面的研究工作,取得了以下进展: 对数据分布的精
图像识别在军事国防以及民用领域的作用日益显著。近些年,从遥感和航拍图像中实现目标的自动识别取得了长足的发展,但目前仍没有一种可以普遍适用的方法。这其中的困难不仅体现
传统工业控制通常以工控机为硬件平台来构建监控系统,这种模式的监控系统存在成本高、体积大、安装及后期维护复杂等缺点。随着微处理器运算、处理能力日益强大,同时随着嵌入式
信息技术的快速发展为网络教学提供了广阔的前景。网络教学作为一种新的教学方法,改变了传统教学方式,提高了教学效果及学生参与教学活动的积极性。与传统的教学模式相比,网络教
在自然语言理解领域,词义消歧(Word Sense Disambiguation-WSD)是基础研究课题,也是重点和难点之一。作者在统计的框架下,多方面地考察词义消歧问题,得到了一些较好的结论,并在此
文件同步分为三个阶段。一是更新检测阶段,检测和发现文件的变化。二是同步决策阶段,决定如何进行文件同步,获得文件同步的具体步骤。三是同步实施阶段,进行具体的数据传输,完成文
面向奥运新闻机器翻译的中文分词研究与实现随着信息时代的到来,“信息爆炸”成为信息处理领域的瓶颈问题,不同语种之间大量的信息交流更加大了问题的严重性。不同语言之间的翻
通信网络的信道是一个开放性信道,它在赋予用户通信自由的同时也给通信网络带来一些不安全性因素。伴随着VoIP的广泛使用,它在给用户带来廉价、方便、功能丰富的语音通信功能的