论文部分内容阅读
P2P结构具有鲁棒性、分散性、负载平衡和可扩展性等特点,是下一代互联网技术发展方向之一,在文件共享和分布式计算领域倍受关注。随着Internet的发展,基于局域网的传统分布式数据库,在管理和共享广域网范围内的数据时显得力不从心,可扩展性较差,而且这种具有严格体系结构及其ACID特性的要求很难适应Internet的动态特性。P2P结构的出现恰恰弥补了这些缺陷,为管理和共享广域网范围内的数据提供了一种高效平台。本文以DHT-based结构化P2P作为分布式平台,设计一种Internet环境下的分布式数据库实现机制。 DHT(Distributed Hash Table)结构化P2P网络具有鲁棒性、自适应性、可用性、负载均衡等特点,但是其缺乏表示、管理复杂语义数据的手段,仅支持关键字精确匹配查询。这恰恰是分布式数据库技术(数据复制,索引机制,查询处理等等)优势,P2P技术和分布式数据库相结合,克服P2P技术的不足,实现广域网范围内数据管理和信息共享。 本文首先对分布式数据库技术进行研究分析,并比较、分析其与P2P技术的不同;其次对三种P2P结构的作必要的分析,从网络结构、体系结构、数据复制等方面对典型的P2P数据管理系统进行研究;在此基础上,本文探讨一种基于DHT P2P的分布式数据库实现机制。 在该系统中,利用数据分割和数据复制,把节点负载分散,达到系统负载均衡和提高可用性;首先,用分割规则把关系表分割成小的数据副本,并对这些小的数据副本进行标识;然后,把这些数据副本和副本定位元数据放置其它节点上,定位元数据负责副本定位。关系表标识、副本标识和物理索引组成一个层次索引机制,达到快速资源定位,并有效保持了副本间的逻辑整体性。 一组联系比较紧密的节点之间存在频繁的数据交换,把这些节点组成一组,并利用协调规则管理数据的存取,实现LDBs之间的数据共享和交换。 利用分层索引和P2P路由算法设计一种资源定位方法,当用户进行数据请求时或查询相关数据时,以关系表名称和查询条件为参数,实现相关副本定位。把数据操作发送给相关节点,执行局部操作,返回数据集。