论文部分内容阅读
推荐系统可以帮助用户发现感兴趣的信息,有效解决信息过载问题。它通过分析用户的历史行为,建立合适的预测模型预测用户的兴趣,从而给用户产生推荐。推荐系统的研究主要集中在评分预测问题,而如何提高预测准确度是评分预测所解决的关键问题,解决该问题的重要方法就是协同过滤算法。此外,近年来隐私保护问题逐渐成为制约推荐系统健康发展的重要因素,推荐系统由于利益驱使而随意修改用户评分误导其他用户。因此,需要一种隐私保护机制来有效保护用户评分免受推荐系统恶意使用。本文从推荐系统中的协同过滤算法预测准确度和用户隐私保护两个方面展开研究,旨在保证用户在获得准确高效推荐的同时有效保护用户评分。首先,研究了Netflix大赛应用的两类高效的协同过滤算法,分别是基于邻域的模型(KNN)和矩阵分解模型(MF),然后基于两个公开的数据集MovieLens和WSQ对协同过滤算法模型的融合方法和模型选择策略进行了深入研究。此外,提出一种面向推荐系统的隐私保护机制,基于同态加密技术加密用户评分数据,在不泄露给推荐系统用户真实评分的情况下使用基于邻域的模型产生推荐。本文的主要工作和贡献如下:1.实现了两类协同过滤算法中的一些经典模型,包括iKNN、 Funk-SVD、 Biased SVD和SVD++,然后使用简单线性回归进行模型融合。最后通过两组实验来分析模型融合策略。实验表明随着融合模型数量的增加预测准确度的提升越缓慢,且不同类模型融合效果要好于同类模型,因此只需要融合少数几种能显著提高预测准确度的模型。2.研究了一种基于Paillier和DGK同态加密系统的隐私保护机制。推荐系统通过与一个半可信的第三方交互来实现对同态加密后评分的相似度计算,进而找出相似用户产生推荐。与基于阈值的相似用户选择策略相比,本文所提出的基于数量区间的相似用户选择策略可以保证对每一个用户找到一定数量的相似用户。