P2P网络中不确定数据Top--k查询处理技术研究

来源 :东北大学 | 被引量 : 2次 | 上传用户:doubaosong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的迅猛发展,P2P网络受到了广泛的重视,并已成为当前最为流行的网络共享应用之一。由于用户并不总是希望找出所有的精确结果,而只需要排列出最符合查询的前k个结果,因而Top-k查询作为基础聚集查询,在很多领域起着重要的作用。在P2P网络中,Top-k查询处理同样占有相当重要的地位。在传感器网络、P2P网络等分布式环境中,由于测量工具的精确度、测试环境和网络延迟都会导致信息的不确定和模糊,所以采集的数据很大程度上是不确定的;近年来,虽然针对集中式数据库中确定数据的Top-k查询研究已经取得了很大进展,但是在P2P网络等分布式环境中,如何高效实现不确定数据的Top-k查询则一直是一个比较困难的问题,也是当前该领域的研究热点之一。本文提出了一种适合于大规模P2P网络环境的不确定数据Top-k查询处理方法,该方法适合于超节点结构的P2P网络,能够充分利用超节点的能力来完成数据的Top-k查询处理。在该方法中,首先使用改进的四叉树索引为本地节点上不确定数据建立局部索引;然后在超级节点上形成汇聚索引,并存储整个网络中不确定数据的一些摘要信息,并以四叉索引树方式构建全局分布环索引,使不确定数据索引分布在不同的超级节点上,从而实现了负载均衡;基于所提出的索引结构,本文首先提出了一种有效的超节点全局数量剪枝策略,能够极大的减少数据的传输代价和计算代价;然后根据超级节点中不确定数据区域上下界关系,提出了一种超级节点本地剪枝方法,以进一步减少计算代价;最后合并有效的候选集,并通过不断剪枝的方法确定最终Top-k查询结果。本文给出大量的模拟实验来验证所提出方法的正确性和有效性,实验结果表明该方法在数据传输代价、剪枝比率和负载均衡等方面都有良好的性能。
其他文献
数据库的性能管理一直是十分重要的一个研究课题.为了减小数据库管理的难度,提高数据库管理员的工作效率,在最大程度上实现数据库系统的自管理,自调节技术逐渐成为了数据库管
随着电子商务网站应用系统在日常生产和生活中的应用不断增加,对于快速建立一个健壮的、可维护的电子商务网站应用系统的需求也日益增长.因此,有必要针对国内企业的现状提出
体视化(Volume Visualization)是科学可视化(Scientific Visualization)的一个重要组成部分,是处理和分析从实验获得的、扫描器测得的或者由计算模型合成的体数据,并对这些体
随着科学计算规模的不断扩大,大规模计算在各行业也日益得到广泛应用。人们对计算能力的需求是无限的,尽管微处理器的速度以摩尔定律——每18个月增长一倍的速度发展,但一些
本文在基于信息化飞速发展和普及的基础上,充分考虑到当前我国财政改革的需要,设计了一种集中支付系统的架构,在这种架构中XML作为一种信息传送与语义描述的标准得到了充分的
二十世纪七十年代,Belady和Lehman等人提出了软件演进的概念,此后,大多数研究者都用软件演进来描述软件系统中的大量变化。近几年,一些研究者又从服务演进角度展开了相关研究
在联机分析处理OLAP环境中,数据以多维模型展现,基于多维数组的计算被频繁地使用。传统SQL语句在这方面存在严重不足,关系型OLAP必须使用连接、CASE表达式、嵌套查询、UNION
地理信息系统是指用于获取、存储、查询、综合、处理、分析和显示与地球表面位置相关的数据的计算机系统。与管理信息系统不同,它可以利用计算机技术模拟现实世界,进行各种空间
随着企业信息化的发展,一个企业往往有很多种异构信息系统在同时使用,形成一些“信息孤岛”,在很大程度上限制了信息系统在企业运作中的作用。例如,在“信息孤岛”下,企业信
远程教育的快速发展,促进了虚拟实验环境的研究,特别是接口类可编程虚拟实验平台的研究.目前对可编程虚拟实验的研究比较滞后,不能满足远程教育日益发展的需求.在国家创新基