论文部分内容阅读
互联网的飞速发展,让更多数据出现在人们身边,与日俱增的数据量为人们的生活提供了极大的便利,使人们在一定程度上摆脱了信息匾乏的困扰。但是在面对如此大的数据量时,要怎样精准地获取人们自己想要的信息却成了一个令人困惑的问题。现有的搜索工具在这样海量数据面前也显得无能为力,而推荐系统的出现为人们的个性化需求带来了福音,并且使得数据的获取更加高效和便捷。本文对几类常用推荐算法进行研究分析,虽然这些算法在不同领域中都有应用,但是仍然存在数据稀疏性、可拓展性等问题。针对这些问题,本文的研究基础是物品推荐系统中的传统协同过滤算法,本文研究了协同过滤算法、相似度计算和评分预测等相关技术,针对传统算法所存在的不足,主要工作如下:(1)考虑到传统协同过滤算法中所存在的数据稀疏、可扩展性差,另外考虑用户评分尺度的不同易导致相似用户寻找不准确等问题,本文引入了欧氏距离和降维等相关理论,提出基于用户相似性和评分预测融合协同过滤推荐算法。对评分矩阵进行改进,将评分均值差和权值的概念用于计算相似度,找寻最近邻,再引入目标用户及其相似用户的平均评分,最后进行推荐。本文用movielens公开数据集进行了多次实验,实验表明:新算法在推荐的准确率和覆盖率上都明显提升。(2)针对稀疏性问题,本文提出了基于物品(User-IIF)和用户(Item-IUF)的热门惩罚后的相似度计算方法,摒弃了传统将未评分的矩阵单元数与矩阵单元总数比值的稀疏度计算方法,考虑了关系密度对于稀疏度的影响,定义计算稀疏度的新方法,并对稀疏度进行加权处理,构建基于用户和物品的协同过滤算法。实验结果表明,新算法的推荐评估指标MAE值优于原算法,有良好的推荐效果。