论文部分内容阅读
近年来随着P2P系统的大量出现,P2P技术逐渐成为人们研究的热点。P2P技术目前主要应用在资源共享、分布式计算、协作系统、电子商务和以P2P为基础的深度搜索引擎等方面。其中,信息检索是最常见的一种应用,对现有的图像、视频等高维数据内容的检索更是迫切的需求。
在P2P共享系统中,每个节点既可以将本地资源共享出来与其它节点分享,又可以从其它节点获取资源,实现了服务器与客户端的两位一体。然而,现有的信息检索机制存在着种种不足:基于结构化P2P网络的检索效率很高,但是由于构造过于严格,难以实现模糊、范围、k-近邻等复杂查询,仅支持精确的单关键字查询;非结构化P2P网络实现简单,但是由于搜索的盲目性,其检索效率普遍比较低。
本文在深入研究P2P信息检索技术的基础上,重点研究了基于结构化P2P网络的信息检索技术和高维数据的索引算法。现有的结构化P2P网络对范围检索等复杂查询缺乏有效的支持;单一的使用降维或近似向量对高维数据进行索引查询,索引时会损失高维数据的大量信息,查询时会引入大量的误中点。以Chord网络为基础,针对iDistance索引进行范围查询时引入大量误中点的问题,论文提出了一种基于分区和距离的高维数据索引方法。首先采用Code-Distance索引技术对高维数据建立一维索引值,并利用位置保持哈希函数为每个索引值赋予一个唯一的标识,然后将该标识保存在Chord环节点上,生成BM-Chord系统。在此基础上,给出了数据过滤策略和范围查询算法。最后用实验结果验证了BM-Chord系统在减少查询的误中点个数、提高查准率等方面的有效性。