基于二分图的混合推荐系统的研究与实现

来源 :北京邮电大学 | 被引量 : 13次 | 上传用户:gzlwh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年随着互联网以及电子商务的飞速发展,互联网中的信息呈现出爆炸性的增长,用户无法从过量无用信息中挖掘出自己需要的物品或者信息,在这种情况下,个性化推荐系统应运而生。个性化推荐系统可以根据用户的喜好为用户推荐物品,帮助用户迅速找到自己的兴趣方向。但是随着个性化推荐系统的广泛应用,冷启动以及稀疏性等问题开始出现,基于单一算法的推荐系统已经不能满足实际需要。同时由于互联网信息的爆炸性增长,基于单机算法的推荐系统已经无法处理大规模数据。基于上述问题,论文对基于二分图的混合推荐系统进行了研究。首先对推荐系统的相关概念进行了介绍,并详细描述了基于隐语义模型的推荐算法SLIM (sparse linear method)以及基于二分图的推荐算法。本文对SLIM的核心思想进行了研究,分析了SLIM的缺点:无法学习未被同一用户评价过的物品之间的相似度;接着基于二分图对SLIM算法进行了改进,提出了一种新的混合推荐算法UIIM (user-item interest model),并通过实验验证了UIIM的推荐质量。其次,针对大规模数据带来的问题,设计实现了基于Spark的并行UIIM算法(Parallel_UIIM),并通过实验验证了Parallel_UIIM的准确性以及效率。经过实验证明,混合推荐算法UIIM的推荐质量要优于SLIM,对于评价量稀疏的用户,质量也同样有所提高;基于Spark实现的Parallel_UIIM算法在大数据规模上的效率要明显优于单机算法。最后,基于海量数据分析平台,设计了混合推荐系统的架构,并基于Mapreduce实现了三个数据预处理的算法,利用并行后的混合推荐算法Parallel_UIIM构建了混合推荐系统,为混合推荐算法的应用提供了案例。
其他文献
随着经济的发展与人们生活方式的改变,中国已成为世界上移动终端用户最多的国家。能够支持移动接收的多媒体广播服务因庞大的移动终端使用人群而显得日渐必要。国际上现有一
自然计算(Natural Computation)是表示由自然启发的计算的一般性术语,其研究内容一般包括人工神经网络,遗传算法,免疫算法,蚁群算法和粒子群算法等。由于多数的自然计算模型