论文部分内容阅读
“信息过载”使我们获取有效信息变得困难,而个性化推荐算法正是对该问题而提出的解决方案,个性化推荐算法中又以协同过滤算法发展最好、应用最为广泛。协同过滤算法通过分析用户对项目的评分信息,找出其中评分数值相似的用户(或项目),通过这些相似用户(或项目)具有的评分信息,对目标用户提供推荐。但是协同过滤中存在着由于项目维度过高、用户评分数据过于稀疏的稀疏性问题,用户兴趣是不断变化的用户兴趣变化问题,以及新用户和新项目由于信息量过少而导致的冷启动问题。上述的这些问题都将会使得协同过滤算法的推荐结果准确度变得偏低,影响整个推荐算法的性能。针对这些缺点,本文中提出了一种新的基于用户与项目的双重聚类协同过滤算法,该算法在前人研究的基础之上,对这些问题都提出了针对性的改进方案。针对数据稀疏性问题,算法中使用用户与项目的双重聚结果,利用聚类结果中同属类的其他用户或项目,对空白评分项进行填充。此种方式得到的填充结果较为可信,在缓解数据稀疏性问题上能够起到非常大的作用。针对用户的兴趣不断变化问题,算法中利用艾宾浩斯遗忘曲线为根据,利用该曲线来描述用户兴趣随时间改变的趋势。在计算用户间相似度时,对用户不同时间的评分进行加权处理,从而获取到的相似度更符合用户当前的实际情况。针对冷启动问题,算法中使用了融合用户属性的用户相似度计量方式和融合项目的项目相似度计量方式两种新型相似度计算方法,充分利用用户和项目自身所具有的的属性,对它们进行相似度分析,使得新用户与新项目也能够找到对应邻居。最后,对本文中的基于用户与项目双重聚类的协同过滤算法进行实验,验证其有效性和准确性。实验中采用的数据集为Movie Lens数据集,实验过程中分别正对算法中的改进项一一进行实验,验证其有效性,最后实验验证整体算法的有效性。最后实验表明,本文算法相比于前人提出的传统协同过滤算法有着更好的推荐结果。