论文部分内容阅读
随着Internet技术的飞速发展,分布式存储技术取得了长足的进步。同时,日益增加的用户和数据,也给分布式存储技术带来了新的挑战。另一方面,随着P2P计算模式的兴起、网络带宽的大幅增加和Internet端系统计算能力的迅速增强,原先被忽视的端用户设备成为一种宝贵的资源。如何充分利用这些端用户设备,在动态的P2P网络环境中构建大规模、高可扩展、高可靠、高性能的分布式存储系统,是近年来研究的热点之一。
网络技术的飞速发展与迅速普及使其在现代社会中的重要性越来越突出,对数据共享的要求也越来越高。目前的分布式P2P系统为我们在数据共享与发布等方面提供了便捷、高效的方法,因此为了能够提高查询效率,需要找到一种更适合分布式系统的分布式空间索引结构。另外高维对象的逻辑结构等自身特性使得对多维数据对象的查询变得更加复杂化,导致了目前现存的空间索引结构大多不适于分布式数据共享系统。
因此为了提高分布式系统的查询效率,本文提出了一种基于高维的更适用于分布式P2P环境的高维数据管理技术——DMF-arch。这种新型的高维数据管理技术首先将整个待查询的数据空间进行层次划分。各个节点通过一个分布式索引结构(IP)对自己周围邻近的信息进行管理,并且采用分布式BloomFilter(DBF)技术对待查区域进行有效的过滤。当某一节点查询请求时,首先进行本地搜索,如果未返回查询结果则根据DBF所提供的信息将该查询向上发送到其父亲节点。
实验表明本文提出的通过层次划分对高维数据进行过滤来解决高维问题的思想在查询效率等方面都优于其他的索引形式。从实验结论中可以看出这种过滤代价几乎可以忽略不计,能够有效地提高索引的查询性能,对于解决高维问题是非常有效的,通过与MR-tree的实验对比也可以看出DMF-arch无论在查询效率还是在查询返回点个数等方面都优于其他的集中式索引形式。