论文部分内容阅读
随着互联网的快速发展,每天呈现在我们周围的信息大批量的不断更新,这也就使得我们面临选择困难的问题,用户无法及时准确地在海量信息里寻找到自己所需的信息,我们称之为信息过载。为了解决“信息过载”问题,各种推荐系统应运而生,协同过滤推荐算法是目前应用最为成熟的技术,但同时协同过滤也暴露了一些不足和缺陷:数据稀疏性、冷启动等。如何解决这些难题已经成为目前推荐系统研究的热点。本文首先介绍了近几年协同过滤算法的相关研究成果以及推荐系统相关技术,然后介绍了常用的几种推荐算法,主要介绍协同过滤推荐算法以及其中的相似度计算方法及存在的问题,接着对协同过滤算法不足之处进行分析总结,对传统的协同过滤算法进行了相应的改进。最后本文通过仿真实验,对改进后的推荐算法进行了测试与分析,阐释了改进后的算法的的可行性与有效性。本文在Jaccard相似度计算的基础上,结合用户对项目的用户评分差异度以及评分的信息熵对相似度计算方法进行改进,提出两种用户相似度的改进方法。最后为了验证所提相似度计算方法的有效性,通过在Movie Lens数据集上的实验,表明了应用本文提出的相似度算法的推荐系统的推荐效果均有显著提高。