结构化p2p网络性能分析与搜索算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:szr520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,对等网络(P2P)日益成为Internet上的一个重要应用。P2P网络中的每个节点既是内容提供者,又是内容消费者。结构化对等网络是扩展性高、容错性好的P2P网络,是当前的研究热点。基于分布式哈希表的结构化P2P网络利用DHT进行资源定位,它将网络中每个资源和节点哈希到同一个值空间,每个共享资源被发布到和自己资源标识符最接近的节点上。这种定位机制虽然有效地解决了非结构化对等网络中洪泛机制所带来的不可扩展问题,却不可避免地带来了另外的一些问题。这些问题主要是:(1)由于节点的频繁加入和离开所引起的路由表更新代价非常大;(2)哈希过程丢失了节点的物理位置信息,使得重叠网络中的邻居物理上可能相距很远,从而使得结构化P2P网络中的查找延迟增大;(3)在抖动率很高时,某些结构化P2P网络随着网络规模的扩大而性能急剧下降;(4)只支持从key到value的精确匹配,不支持多关键字搜索,搜索效率不高。  当前,结构化P2P网络的研究主要集中在对现有的DHT协议的直接改进上,很少通过对网络的性能进行分析而提出改进方案。这种方法存在着两个缺点,一是这种改进只针对某种DHT协议,如Tapestry,没有普遍意义;二是容易造成顾此失彼,如常量度数的DHT算法虽然降低了查询跳数,但对于节点的异常离开的处理能力较差,容错性能大大降低。为了更有效解决上述问题,有必要从路由表更新代价、查找延迟和抖动环境下的可扩展性等网络性能指标对典型结构化P2P网络的性能进行整体分析,进而提出改进算法和方案。从而提高结构化P2P网络的整体性能。  为了找出影响网络抖动的关键因素,首次提出了反向邻居节点的概念,即把自己作为邻居节点的节点,在此基础上,计算了六种DHT网络的反向邻居节点数。分析了影响抖动的路由方式、邻居选择、节点加入和节点离开以及并行查找等策略因素。发现对任意两种DHT网络,它们分别采用的五种策略都至少有两种不同,于是,对两种DHT网络直接进行比较就很难确定哪些策略能更有效地降低抖动。因此,提出在同一网络内,用不同的单个策略对网络抖动进行比较和分析的方法,称之为CSP。对现有的Pastry算法进行改进,构造了使用快速加入策略的F_Pastry算法和周期性恢复策略的P_Pastry算法。并分别把F_Pastry、P_Pastry和原有版本的慢速加入、反应性恢复算法进行了比较。还把使用迭代路由的Chord协议和使用递归路由的Chord协议进行了比较,得出以下结论:迭代路由、快速加入和周期性恢复策略和有效的邻居选择算法能更有效地降低网络的抖动。  研究发现,数据存放机制、路由方式、邻居选择和服务选择方式等,是影响结构化P2P网络查找延迟的关键因素。通过对一些典型结构化P2P网络查找延迟的比较和分析,提出了降低内容寻址网络节点间延迟的DCAN算法。该算法将内容寻址网络中的节点抽象成一个无向带权图,在此基础上,把Dijkstra算法求得的源节点到目的节点的最短路径作为路由。仿真实验表明,和路由过程中每次选择最小的下一跳的算法相比,DCAN算法能更有效地降低从源节点到目的节点的总延迟。  为了研究抖动环境下各种结构化P2P网络的可扩展性,提出了LBE评价方法。该方法把成功查找的时间延迟和查找失败率随网络规模的变化作为衡量可扩展性好坏的标准。随机改变DHT的各种参数,得到一系列查找延迟时间,把它们形成的最低线作为网络的整体性能指标。固定某一参数,但随机改变其它参数再进行仿真,从而得到最佳网络整体性能条件下的参数值。用上述方法对三种DHT协议的可扩展性进行了综合分析,并得出了相应的结论。  通过分析现有多关键字搜索算法的缺点,提出了ICCCS搜索算法,该算法在DHT协议层之上建立逻辑的关键字搜索层,搜索层采用改进的超立方体互联圈(Improved Cube-Connected Cycle)结构。通过向量空间模型选择每个对象的重要关键字,并将其映射到ICCC节点的环号,然后将描述对象的整个关键字集映射到ICCC节点的立方体标号。基于反向文档索引技术建立了索引算法,并使用生成树建立了搜索算法。实验结果表明,该算法对于关键字较少的查询有较高的查找精度和较低的查找延迟。
其他文献
随着Internet的普及,校园网的规模越来越大,功能也越来越强。在校园网日趋成熟的今天,我们同时也发现校园网存在着不少问题,诸如缺乏合理的管理模式,缺乏灵活的计费策略,网络
脉冲耦合神经网络(Pulse Coupled Neural Network,PCNN)是一种基于生物背景的神经网络。作为第三代人工神经网络,PCNN在图像处理领域有着非常广泛的应用,主要应用于图像去噪
复述是自然语言中非常普遍的一个现象,它集中反映了语言的多样性,已经被应用到信息检索、自动问答、信息抽取、自动文摘、机器翻译等多个领域。本文从相关语料库出发,运用多种自
查询扩展作为解决词的不匹配问题的一种解决方案,有效的解决了目前Web信息检索存在的查全率和查准率低的问题,引起国内外很多学者的注意并参与。然而目前查询扩展方法仍然存
医学图像计算机辅助识别工作属于数字图像处理的一个分支。现在越来越多的专家和学者开始涉足这一领域,并取得了较大的发展。本文在肝癌B超图像领域中做了一些计算机辅助诊断
作为虚拟现实的基础,三维虚拟场景建模与仿真技术受到越来越多的重视,并得到了广泛的应用。三维虚拟场景主要包括地形、地物、自然景观与自然现象等因素,为了避免地物悬空或
实时数据库是其事务和数据都具有显示定时限制的数据库系统,系统的正确性不仅依赖于事务的逻辑结果,而且依赖于逻辑结果产生的时间。随着对工业生产过程的智能化要求越来越高
运动目标检测和跟踪是研究在图像序列中提取运动目标区域,分析运动目标特征和运动状态,并对之进行跟踪和估计有关运动参数的分析技术。它是图像处理与计算机视觉领域的一个非常
国家电网公司从“十一五”以来积极开展“SG186”工程建设,大力推进信息化建设,开始构建电力数据中心。随后“十二五”期间,提出了构建坚强智能电网和三集五大体系的重大举措,要求信息通信能力进一步全面提升,确保相关支撑信息系统能够稳定运行。数据量的剧增,将造成电力数据中心规模的不断增大、数据交换的不断加快,对海量智能电网信息的存储过程提出了更高的要求。然而传统的数据中心网络的具有服务器到服务器连接和带
教学计划是高校实施常规教学活动的基本管理文档,由于传统的手工编制方式存在诸多弊端,开发基于Web应用程序形式的教学计划编制系统具有很好的应用价值。本文以UML为建模工具