论文部分内容阅读
随着网络技术的发展,互联网的用户数量越来越多,传统的集中式的C/S网络模式因存在服务器单点失效和负载过大的问题面临着越来越多的问题和挑战,P2P网络作为一种新型的网络模式应运而生。在P2P网络模式中弱化了中央服务器的概念,节点既可以充当客户端又可以充当服务器端,能够很好的解决C/S网络模式的不足,受到学术界和各研究界的广泛关注。P2P网络模式因其良好的可扩展性和节点自组织等优势被广泛的应用在资源共享、协同办公、分布式计算、流媒体传输和即时通讯等领域;而这些应用面临的一个核心问题就是如何在海量的数据资源中获取用户所需要的资源,因此,如何建立高效的资源定位机制就成为P2P网络研究的一个热点。在本文中,根据现有的资源,分别对非结构化和结构化对等网络资源搜索机制进行了分析:非结构化对等网络搜索算法中存在的问题是冗余消息数太多,效率搜索低,因此改进的方向应该是尽可能降低这种繁冗消息的数量,提高搜索效率;而结构化P2P网络的搜索算法中存在的问题是只能提供基于单关键字的精确匹配查询,而不能很好的支持模糊查询,所以应该朝着能够实现支持多关键词查询的方向改进。本文的主要研究内容如下:首先,对P2P网络的相关知识进行了详细分析。分别介绍了P2P网络的特点,应用和拓扑结构的概念,还包括国内外研究的现状,背景和研究意义,重点突出了典型的P2P网络资源搜索机制。其次,提出一种基于top-k查询的非结构化P2P网络资源搜索策略TKsearch。针对在Flooding算法中存在的节点负载太大、查询效率低的现象进行了改进。在该算法中使用向量空间模型VSM将文档描述为带有权重的向量的形式;在选择下一个转发节点时是采用基于文档相似度和节点的吸引力之和的概率转发机制,结合转发公式,选择满足条件的邻居节点转发查询请求;然后在该策略中引入了伙伴节点,即与本地节点有最大兴趣相关度的节点,并周期性的对伙伴节点进行更新,对选择转发路径有一定的指导作用;考虑到用户可能不关心所有返回结果,而只关心很小的一部分,所以引入了top-k函数,借助于查询树仅返回满足条件的top-k个最优结果。最后将此搜索算法与洪泛搜索算法进行了实验比较,仿真实验表明该算法能够有效降低消息冗余度,提高搜索的效率。最后,提出一种基于本体和VSM模型的结构化P2P语义检索策略。该策略是对Chord搜索模型的改进,在该算法中使用向量空间模型对文档进行描述,求得相似角,然后按照DHT的原理将其映射为空间标识符vector,使Chord模型中原有的二元组<key,value>改进为三元组<vector,key,value>;在获得拥有查询信息的节点的索引信息之后,可以再借助于ontology技术以求在语义层面上将相关资源传输给请求者;另外,节点除了维护原有路由表以外还维护一张伙伴节点表,存储的是与本地节点有最大兴趣相关度的节点,可以加快语义检索的速度。实验结果表明,该算法能够有效提高网络中的查全率,降低网络搜索延迟。