基于Maze文件价值的相关排序系统的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:clhsmith001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Maze是目前中国教育网内最大的P2P文件共享系统,系统中有着大量的用户共享文件,Maze中部署着一个提供共享文件查询服务的索引和检索系统。现有的Maze索引和检索系统认为所有的资源拥有同样的权重,检索结果可简单的按文件镜像数或创建时间来排序。然而Maze系统中存在着大量无用或低质量的文件;当用户进行检索时,这些文件可能会占据返回给用户的检索结果集合。Maze系统中需要一个关于共享文件的相关排序系统。   本文首先介绍Maze索引和检索系统,总结了目前索引系统的现状,并分析了其中存在的问题。然后从Maze用户的检索和下载行为出发,综合考虑Maze系统中用户与共享文件间的各种联系,提出了一个基于用户检索行为与利用用户行为模拟投票相结合的相关排序系统。   系统分别从两个相互独立的角度来评价共享文件价值:第一,从用户检索词中提取关键词特征项,并计算特征项的权值,同时将共享文件切分为特征项向量,通过其中特征项的可信度加权计算共享文件的价值;第二,利用共享文件.镜像关系和用户与共享文件的下载关系模拟投票行为,设计用户对共享文件价值的投票模型,用户的投票权通过用户间的信任度迭代计算。   最后在Maze索引和检索系统中实现了基于以上两个计算结果的相关排序系统。   本文设计并实现了基于多种用户行为的共享文件相关排序系统的模型,通过测试验证了系统的效果,提高了Maze系统中用户的检索体验,并为其他应用提供了接口。     
其他文献
自从世界上首例手机病毒“VBS.TimoFonica”于2000年6月发现以来,移动终端恶意代码的数量在不断的增加,危害性不断增强。目前移动终端恶意代码发作时,能够破坏系统软硬件设备
推荐系统是一种利用用户与产品之间的相互关系以及相关信息为用户进行个性化推荐的系统。最早出现于二十世纪九十年代中期,用于为用户进行USENET上的新闻推荐。随着逐步的发
无线射频识别(RFID)技术是目前国际研究的热点之一,它可以应用在以供应链管理为代表的国民经济的各个领域。由于技术和市场等诸多因素,至今还没有走向大规模的开环应用。在RFID应
学位
天网FTP资源搜索引擎是对中国部分IP集合进行扫描,获取其中匿名FTP站点文件信息来为广大互联网用户提供资源搜索服务的垂直搜索引擎。随着中国IP集合以及引擎扫描集合变大,旧
无线射频识别(RFID)技术的应用越来越广泛,目前已成为国内外研究的热点。但目前绝大多数RFID应用仅限于企业内部的闭环应用,尚未走向跨地区、跨行业乃至全社会的规模化应用。其关
学位
随着经济的发展,我国的社会化进程加快,各方面都取得了快速的发展和提高,这就产生了一个需求,即如何更好的适应和指导这些发展变化。而这些都离不开对宏观经济走势的把握,无论是对
学位
禽流感的每次爆发都会对全球的经济产生巨大的冲击,而野生鸟类是禽流感感染的主要群体,是疫情传播的主要源头之一。当前对禽流感的预防和控制一直是一个巨大的科学难题,目前采用
随着集成电路制造工艺的进步和处理器设计技术的发展,单发射处理器凭借其在低成本、低功耗和高可扩展能力方面的优势,获得了日益广泛的应用,表现出了强劲的生命力。为进一步满足
学位
随着互联网上提供相同功能Web服务的数量日益增加,如何找到适合服务请求者需求的Web服务已成为服务计算领域研究的热点。目前普遍关注的基于QoS的Web服务发现的研究工作中还
访问控制是网络安全标准化的ISO国际标准组织在信息系统的安全基础设施的定义(ISO7498-2)必须包括5个安全服务,信息安全和保护一对主要的技术和有效的手段。传统的访问控制是
学位