基于分布式的推荐系统研究与应用

来源 :北京大学 | 被引量 : 0次 | 上传用户:cmdgjb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,针对每一个用户提供不同的个性化服务的推荐系统已经深入到互联网的各个领域。本文对推荐系统的国内外研究和应用现状进行了调研,然后提出了一个推荐系统框架来改善推荐系统存在的部分问题。  本文首先针对推荐系统中存在的冷启动问题,通过对物品的内容进行特征抽取,进而通过分析用户模型进行用户建模,再对基于内容的推荐算法和基于用户行为协同过滤的推荐方法进行后端融合,来缓解推荐系统的冷启动问题。其次,针对处于推荐系统中核心地位的相似度计算,本文认为传统的向量相似度计算方式存在一些不足,提出了相似度计算的改进方法:在基于内容的推荐算法中,使用机器学习的方法来解决物品特征相似度的线性加权问题;在基于用户协同的推荐算法中,引入区分度来改善用户的相似度计算方法。针对海量内容和海量用户环境下相似度算法耗时较长从而导致实时推荐难以实现的问题,提出了后台与前台分离的系统框架。对于后台的相似度计算,本文使用分布式计算框架来加快计算流程,前台只需要获取相似度数据,而后进行基于用户兴趣与当前场景的重排序,就可以给用户提供实时推荐结果,提高了推荐系统的实时性,更好的适应了海量数据环境。对于用户兴趣问题,本文使用心理学模型来刻画用户长期兴趣的动态变化,并将用户的显式和隐式反馈用于描述用户的短期兴趣,来改善排序的结果。最后,本以电影推荐为例,实现了一个电影推荐系统原型,并给出这个系统在新闻和音乐推荐的扩展方式。
其他文献
非功能需求建模在软件工程领域越来越受到重视,存在着多种分析和建模方法,其中NFR Framework是一种发展迅速和应用广泛的框架。该框架的思想是用软目标来表示非功能需求,将顶层
手指静脉识别技术是近十年来新兴的生物特征识别技术。她具有防伪性好、识别率高等优点,因而具有广阔的市场前景。六年来作者所在的研究小组自主研发了手指静脉的采集设备,并
随着近年来智能移动设备的快速普及和移动互联网的高速发展,电子文档被越来越多的使用和传播。而在电子文档中,需要使用一种良好的数据格式来用于保存和传输数据。XML由于良
近十年以来,互联网的发展速度超乎人们的想象,网络中的内容不断呈爆炸趋势增长。如今人们使用互联网时更在意网络中的内容,但是网络的通信模型却是基于位置的,仍然沿用上个世
内容中心网络(Content-centric networking,CCN)是由美国帕罗阿图研究中心提出并致力于发展的下一代基于内容的互联网的基础协议及底层架构。随着近十几年来互联网上用户和内
众所周知,地理问题分析与求解是一个非常复杂的过程。而将分析出的地理模型实现成可运行的程序更是一项庞大的工程,需要消耗很多的人力和财力。当前现状是,大量实用地理模型己被
失语症形成的原因有多种多样,脑卒中等神经疾病是导致言语缺失最常见的原因。由脑卒中引起失语症可以通过言语康复训练进行恢复,从而提高他们的交流能力,让他们更好的融入生活。
音乐情感分类在音乐检索和音乐推荐等方面具有广泛的应用。国内主流的搜索引擎百度(Baidu)和门户网站网易(163)都相继推出了音乐情感检索系统,但检索的准确率都不高。以往的
船舶自动识别系统(Automatic Identification System,简称AIS),是新一代的海上通信导航系统,能够实现船舶、船岸间的船舶表示、位置、航向、航速等航行信息的自动交换。随着船舶自
作为许多数值模拟的前处理过程,网格生成过程很大程度上影响着求解的效率和正确性。非结构网格由于其对复杂外形的良好适应性,正逐渐成为诸如计算流体力学(CFD: Computational