推荐系统中协同过滤算法及隐私保护机制研究

来源 :东北大学 | 被引量 : 5次 | 上传用户:wanghn019
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统可以帮助用户发现感兴趣的信息,有效解决信息过载问题。它通过分析用户的历史行为,建立合适的预测模型预测用户的兴趣,从而给用户产生推荐。推荐系统的研究主要集中在评分预测问题,而如何提高预测准确度是评分预测所解决的关键问题,解决该问题的重要方法就是协同过滤算法。此外,近年来隐私保护问题逐渐成为制约推荐系统健康发展的重要因素,推荐系统由于利益驱使而随意修改用户评分误导其他用户。因此,需要一种隐私保护机制来有效保护用户评分免受推荐系统恶意使用。本文从推荐系统中的协同过滤算法预测准确度和用户隐私保护两个方面展开研究,旨在保证用户在获得准确高效推荐的同时有效保护用户评分。首先,研究了Netflix大赛应用的两类高效的协同过滤算法,分别是基于邻域的模型(KNN)和矩阵分解模型(MF),然后基于两个公开的数据集MovieLens和WSQ对协同过滤算法模型的融合方法和模型选择策略进行了深入研究。此外,提出一种面向推荐系统的隐私保护机制,基于同态加密技术加密用户评分数据,在不泄露给推荐系统用户真实评分的情况下使用基于邻域的模型产生推荐。本文的主要工作和贡献如下:1.实现了两类协同过滤算法中的一些经典模型,包括iKNN、 Funk-SVD、 Biased SVD和SVD++,然后使用简单线性回归进行模型融合。最后通过两组实验来分析模型融合策略。实验表明随着融合模型数量的增加预测准确度的提升越缓慢,且不同类模型融合效果要好于同类模型,因此只需要融合少数几种能显著提高预测准确度的模型。2.研究了一种基于Paillier和DGK同态加密系统的隐私保护机制。推荐系统通过与一个半可信的第三方交互来实现对同态加密后评分的相似度计算,进而找出相似用户产生推荐。与基于阈值的相似用户选择策略相比,本文所提出的基于数量区间的相似用户选择策略可以保证对每一个用户找到一定数量的相似用户。
其他文献
以并行计算为基础的高性能计算已经成为人类科学研究的第三大支柱。高性能是使用并行计算的首要原因,而正确是使用并行程序的首要条件。以前的并行程序设计和分析辅助工具都仅
随着移动通信网发展,相应网络规划也越来越复杂,传播模型的模拟和计算分析,难度越来越大,传统的网络规划方法周期过长,无法适应发展。 本文从电信事业的当前发展形势出发,对几个
随着人们生活水平的提高,一户一表甚至一户多表成为可能,而且电能表费率也由以前的一成不变,改为由时段来决定“峰、平、谷”这三种或更多的费率。这种发展趋势致使抄取电能表数
随着Internet技术的飞速发展,远程教学作为一种新型的教育模式已经成为近年来各国教育界的重要研究课题。其中实验教学的实现成为了研究的重点和难点,而虚拟实验室是解决这一问
本文主要介绍了电费核算中心系统中基于角色的组织层次式访问控制设计的应用,文章内容结构如下:在第一章中,首先介绍了目前主流的访问控制策略,其中的自主访问控制(DAC)、强制访
随着Agent概念的出现,多Agent系统的研究和应用得到了广泛的发展。目前,水下多机器人系统是多Agent系统的一个重要应用领域。由于信道带宽等条件的限制,水下机器人间的通信是
  本文提出了一种改进的基于分割的MT三维医学图像表面重建算法,该算法主要在以下几个方面对传统的MT算法做了改进:引入了分割的概念,以便对不同的生物组织采用不同的分割方法
随着计算机支持的协同工作技术广泛的应用,对支持协同工作的信息共享要求越来越高,不但要求对环境中分布的操作型数据协同共享,而且还需要对环境中分布的分析型数据协同共享。本
工作流管理系统(WfMS)自出现以来,在一定程度上推动了企事业生产和管理的发展,而反过来,企事业生产和管理的发展又对工作流管理系统提出了更高的要求。因此,为了满足企事业的
人们在图形图像方面的需求也不断增加,提出了科学计算可视化的概念。图形图像处理科学与技术逐步向其他学科领域渗透,并为其他学科所利用是科学发展的必然。在地质领域实现油气