基于兴趣度的P2P信息检索机制研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:ztzyls
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为知识的直接来源,各类文本文件是P2P文件共享系统中重要的共享资源。对于文本文件的有效利用,依赖于高效的信息检索技术。因此P2P系统中的信息检索(Information Retrieval, P2P IR)有着比较重要的研究价值。结合主题模型和模糊理论,以基于相似度的节点发现方法为基础,研究一种基于任务的P2P兴趣组形成机制。与其他兴趣组形成机制不同,兴趣组形成机制通过利用节点的资源特征,实现了在纯粹的P2P系统中以完全自动和自治的方式形成兴趣组。由于节点很可能具有多个主题,为了对主题进行分类,给出了节点聚类算法。P2P兴趣组形成机制可以由单主题扩展到多主题。基于P2P兴趣组的信息检索机制,在兴趣组内建立兴趣簇,进行兴趣簇内检索、兴趣簇间检索和兴趣组间的检索。对于兴趣簇内检索、兴趣簇间检索,为了减少查询开销、提高检索效率,选择部分与查询相关度高的节点来执行查询任务。在兴趣组间的节点间建立捷径,通过捷径节点可以加入到另一个节点的兴趣组里。仿真实验表明,在形成P2P兴趣组的前提下,同时结合有效的兴趣簇形成,节点选择,建立捷径等方法,基于P2P兴趣组的信息检索机制可以在较小的查询开销情况下得到较好的检索结果。
其他文献
由于集群的可扩展性好,性能价格比高,集群在服务器体系结构中所占的比重越来越大,集群应用的领域越来越多,如科学计算、生物工程、Web服务、FTP服务、E-Mail服务等等,这些集
下一代互联网的研究和建设正逐步成为信息技术领域的热点之一。而下一代互联网的网络安全则是下一代互联网研究中的一个重要的领域。目前中国第一个下一代互联网主干网CERNET
近年来,Internet网络流量剧增,并具有很强的突发性和不可预测性,对有效利用带宽提出了新的要求;同时,各种新业务不断出现,用户对QoS(Quality of Service)提出了不同的要求。I
企业信息化是国家信息化的重要组成部分,是贯彻落实“以信息化带动工业化”战略的重要举措,是带动企业各项工作创新和升级的重要突破口,是增强企业国际竞争力,实现跨越式发展的客
P2P流媒体系统根据发送节点的数量可以分为两种类型:单源(single source)的P2P流媒体和多源(multi-source)的P2P流媒体。实际上,单个节点没有能力或者根本不愿意提供足够大的
评价Ad Hoc网络的算法或协议优缺点主要通过仿真的方法来对比,但是模拟工具的不同和设置参数的不同容易使对同一个算法或协议的模拟结果也不同,因此进行参数初始化的时候可以通
基于图像的信息隐藏技术已经比较成熟,应用也日益广泛,但基于动态视频图像的信息隐藏技术目前还处在研究阶段。信息隐藏比加密技术更具有生命力,它能在不改变原始文件的大小的情
无线Mesh网络是一种新兴的并具有广泛应用前景的无线网络技术。但目前无线Mesh网络的发展还并不十分成熟,仍有许多问题亟待研究和完善。而路由技术是影响无线Mesh网络性能的关
如今,过程控制系统中的历史数据库(简称过程控制历史数据库)在信息化时代的工业生产中显得越来越重要,它专门用来存储和管理生产线中的过程数据,如温度、压力、流量、密度等。一
文档复制检测技术是数据安全领域中一个重要的研究课题,是保护知识产权和提高信息检索效率的一种有力手段。文档复制检测就是判断一篇给定文档是否抄袭﹑剽窃或者复制于另外一