论文部分内容阅读
对等网络(Peer-to-Peer Network,简称P2P)打破了传统的“客户机/服务器”模式,能够提高网络工作效率、充分利用网络带宽、开发每个网络结点的潜力、具有高可扩展性和容错性,因此迅速兴起并成为计算机学术界和工业界研究的热点。查询处理是P2P网络的核心问题,由于P2P网络具有分布性、动态性、异构性等特点,使得P2P环境下的查询处理不断面临新的挑战和机遇。本文针对P2P环境下查询处理中的路由与定位算法、复杂查询处理、P2P Web搜索中多关键字查询路由、社会网络信息检索、无结构P2P网络资源查找等内容进行研究。主要工作包括以下几点:(1)提出了一个支持语义局部性的高容错的结构化路由协议-RingS。 RingS提供基于key的查询服务,可以实现高效的数据定位。RingS除了具有对数阶的高效路由和较强的容错性以外,还可以支持显式的语义局部性,并具有通用性。在动态的网络环境中,尤其在出现网络分割的情况时,RingS仍能保证部分结点正常工作。通过实验验证了RingS是一个可用、高效的分布式路由协议。(2)提出了基于Termset的多关键字查询处理策略。考虑了多关键字之间的相关性,基于Termset来构建索引和进行查询处理,同时采取多种策略进一步减少带宽消耗。有效降低了基于单关键字构建索引并采用分布式交集操作实现多关键字查询处理时的网络通信开销。通过实验验证了该方法的有效性。(3)提出了一种有效的基于收益的多关键字查询处理策略。针对P2P环境下Web搜索中的查询关键字的分布和各种特征,挖掘关键字的关联性和结点间覆盖度和重叠度,应用纳什均衡构建基于收益的最优对等组,并利用最小独立置换进行重叠检测,该策略避免了对相同记录的冗余路由,进一步减小了网络通信代价。通过实验验证了方法的有效性。(4)提出了一种支持社网信息检索的查询处理策略PIST。PIST构建于结构化P2P网络RingS之上,提供了分布式的索引和查询处理机制。同时利用了文档标签、用户的兴趣、好友列表和用户的反馈信息提供个性化搜索,提高了搜索的性能。通过实验验证了PIST的可行性和有效性。(5)提出了一种基于语义聚类的资源查找策略SC-Search。通过构造语义森林算法对结点的本地资源进行聚类,并在结点间建立相似链接实现具有相似资源的结点聚类,进而基于相似链接进行资源查找。进一步,对相似链接进行动态优化,使得相似结点集合在物理网络上更接近。在转发查询请求时,结合了定向模式和泛洪模式,并增设了动态TTL机制,进一步提高了资源查找的成功率和效率。通过实验验证了SC-Search是切实可行的。(6)设计并实现了P2PSearcher原型系统。实现了本文所提出的路由与定位算法、复杂查询处理、社网信息检索等理论和方法,并验证了这些理论和方法的正确性和有效性。总之,本文研究了P2P环境下查询处理技术相关的路由与定位算法、复杂查询处理、社会网络信息检索、无结构P2P网络资源查找等问题,提出了新颖、有效的解决方法,能够有效地解决P2P环境下查询处理缺乏语义、效率低下等问题。理论分析和大量的实验结果证明了这些方法的有效性和高效性。这些方法和技术对于这一领域的研究工作都具有一定的参考价值。